CN110532351A - 推荐词展示方法、装置、设备及计算机可读存储介质 - Google Patents

推荐词展示方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110532351A
CN110532351A CN201910656435.4A CN201910656435A CN110532351A CN 110532351 A CN110532351 A CN 110532351A CN 201910656435 A CN201910656435 A CN 201910656435A CN 110532351 A CN110532351 A CN 110532351A
Authority
CN
China
Prior art keywords
word
recommendation
feature
recommends
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910656435.4A
Other languages
English (en)
Other versions
CN110532351B (zh
Inventor
王晓峰
苑爱泉
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oral Communication (beijing) Network Technology Co Ltd
Original Assignee
Oral Communication (beijing) Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oral Communication (beijing) Network Technology Co Ltd filed Critical Oral Communication (beijing) Network Technology Co Ltd
Priority to CN201910656435.4A priority Critical patent/CN110532351B/zh
Publication of CN110532351A publication Critical patent/CN110532351A/zh
Application granted granted Critical
Publication of CN110532351B publication Critical patent/CN110532351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种推荐词展示方法、装置、设备及计算机可读存储介质,涉及互联网技术领域,根据用户当前的环境参数获取至少一个推荐词,并基于推荐词打分模型对至少一个推荐词进行打分,从而在至少一个推荐词中提取目标推荐词进行展示,使得在不同的场景中为用户确定的推荐词是不同的,并不是完全根据用户的历史行为确定的,为高质量的推荐词提供了展示的机会,提高推荐词的价值,搜索效果更加理想。所述方法包括:根据用户当前的环境参数,获取至少一个推荐词;基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分;在所述至少一个推荐词中提取目标推荐词,并展示所述目标推荐词。

Description

推荐词展示方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及互联网技术领域,特别是涉及一种推荐词展示方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网技术的不断发展,基于互联网技术实现的搜索服务也日渐成熟,越来越多的用户使用互联网搜索想要查看的信息。当用户在网页中搜索信息时,网页通常会确定推荐词,并使用推荐词来引导用户进行搜索,以帮助用户补全搜索内容,从而减少了用户的搜索成本,向用户提供更加精准的搜索功能。推荐词作为搜索引擎的入口之一,在整体搜索流量中占有较高的比重,提高推荐词的展示效率对于提升搜索引擎的流量具有十分重要的作用。
相关技术中,在展示推荐词时,考虑到推荐词的个数较多,需要统计推荐词的特征,根据统计得到的特征,采用推荐词排序算法对推荐词进行排序,并按照排序结果展示一定数量的推荐词。
在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
有些推荐词的特征较多,使得这些推荐词会成为高频推荐词被多次的展示,而有些推荐词的特征较少,使得这些推荐词成为低频推荐词很少被展示,但是低频推荐词中有些是高质量的推荐词,也即对用户具有良好的引导效果,导致这些高质量的推荐词展示的次数过低,推荐词的价值不高,搜索效率不理想。
发明内容
有鉴于此,本发明提供了一种推荐词展示方法、装置、设备及计算机可读存储介质,主要目的在于解决目前高质量的推荐词展示的次数过低,推荐词的价值不高,搜索效率不理想的问题。
依据本发明一个方面,提供了一种推荐词展示方法,该方法包括:
根据用户当前的环境参数,获取至少一个推荐词,所述环境参数至少包括位置信息和时间信息;
基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分,所述推荐词打分模型根据所述用户对推荐词的历史点击行为建立;
在所述至少一个推荐词中提取目标推荐词,并展示所述目标推荐词,所述目标推荐词的词语得分符合推荐标准。
在另一个实施例中,所述根据用户当前的环境参数,获取至少一个推荐词之前,所述方法包括:
根据所述用户对推荐词的历史点击行为,获取样本推荐词以及所述样本推荐词的点击频次;
统计所述样本推荐词的展示次数,计算所述点击频次与所述展示次数的比值作为所述样本推荐词的点击率;
提取所述样本推荐词的多个词语特征,计算所述多个词语特征中每个词语特征的平均点击率作为特征分数;
分别将所述多个词语特征与对应的特征分数进行组合,建立所述推荐词打分模型。
在另一个实施例中,所述根据用户当前的环境参数,获取至少一个推荐词,包括:
对所述用户当前所处场景进行定位,确定所述位置信息,获取在预设历史天数内与所述位置信息相关的多个候选推荐词;
确定当前的所述时间信息,根据所述时间信息所在的目标时间段,对所述多个候选推荐词进行筛选,得到所述至少一个推荐词。
在另一个实施例中,所述获取在预设历史天数内与所述位置信息相关的多个候选推荐词,包括:
查询所述位置信息在所述预设历史天数内发生的交易行为和点击行为;
在所述交易行为涉及的交易账单中提取第一候选词,所述第一候选词至少包括交易店铺名称、交易店铺类目以及交易店铺商圈;
在所述点击行为涉及的点击数据中提取第二候选词,所述第二候选词至少包括点击店铺名称、点击店铺类目以及点击店铺商圈;
将所述第一候选词和所述第二候选词作为所述多个候选推荐词。
在另一个实施例中,所述基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分,包括:
对于所述至少一个推荐词中的每个推荐词,基于所述推荐词打分模型,提取所述推荐词的至少一个待打分词语特征;
获取所述至少一个待打分词语特征在所述推荐词打分模型中对应的至少一个特征分数;
计算所述至少一个特征分数的第一分数总和作为所述词语得分;
重复执行上述生成词语得分的过程,得到所述至少一个推荐词的词语得分。
在另一个实施例中,所述方法还包括:
提取所述环境参数的环境特征;
如果所述至少一个待打分词语特征中存在与所述环境特征相同的交叉特征,则获取第一权重和第二权重;
计算所述至少一个待打分词语特征中除交叉特征外的其他待打分词语特征的特征分数的第二分数总和;
计算所述交叉特征的特征分数的第三分数总和;
计算所述第二分数总和与所述第一权重的第一乘积,计算所述第三分数总和与所述第二权重的第二乘积,将所述第一乘积与第二乘积的和值作为所述词语得分。
依据本发明第二方面,提供了一种推荐词展示装置,该装置包括:
第一获取模块,用于根据用户当前的环境参数,获取至少一个推荐词,所述环境参数至少包括位置信息和时间信息;
打分模块,用于基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分,所述推荐词打分模型根据所述用户对推荐词的历史点击行为建立;
展示模块,用于在所述至少一个推荐词中提取目标推荐词,并展示所述目标推荐词,所述目标推荐词的词语得分符合推荐标准。
在另一个实施例中,所述装置包括:
第二获取模块,用于根据所述用户对推荐词的历史点击行为,获取样本推荐词以及所述样本推荐词的点击频次;
统计模块,用于统计所述样本推荐词的展示次数,计算所述点击频次与所述展示次数的比值作为所述样本推荐词的点击率;
提取模块,用于提取所述样本推荐词的多个词语特征,计算所述多个词语特征中每个词语特征的平均点击率作为特征分数;
建立模块,用于分别将所述多个词语特征与对应的特征分数进行组合,建立所述推荐词打分模型。
在另一个实施例中,所述第一获取模块,包括:
定位单元,用于对所述用户当前所处场景进行定位,确定所述位置信息,获取在预设历史天数内与所述位置信息相关的多个候选推荐词;
确定单元,用于确定当前的所述时间信息,根据所述时间信息所在的目标时间段,对所述多个候选推荐词进行筛选,得到所述至少一个推荐词。
在另一个实施例中,所述定位单元,用于查询所述位置信息在所述预设历史天数内发生的交易行为和点击行为;在所述交易行为涉及的交易账单中提取第一候选词,所述第一候选词至少包括交易店铺名称、交易店铺类目以及交易店铺商圈;在所述点击行为涉及的点击数据中提取第二候选词,所述第二候选词至少包括点击店铺名称、点击店铺类目以及点击店铺商圈;将所述第一候选词和所述第二候选词作为所述多个候选推荐词。
在另一个实施例中,所述打分模块,包括:
第一提取单元,用于对于所述至少一个推荐词中的每个推荐词,基于所述推荐词打分模型,提取所述推荐词的至少一个待打分词语特征;
第一获取单元,用于获取所述至少一个待打分词语特征在所述推荐词打分模型中对应的至少一个特征分数;
第一计算单元,用于计算所述至少一个特征分数的第一分数总和作为所述词语得分;
所述第一提取单元,还用于重复执行上述生成词语得分的过程,得到所述至少一个推荐词的词语得分。
在另一个实施例中,所述打分模块,还包括:
第二提取单元,用于提取所述环境参数的环境特征;
第二获取单元,用于如果所述至少一个待打分词语特征中存在与所述环境特征相同的交叉特征,则获取第一权重和第二权重;
第二计算单元,用于计算所述至少一个待打分词语特征中除交叉特征外的其他待打分词语特征的特征分数的第二分数总和;
第三计算单元,用于计算所述交叉特征的特征分数的第三分数总和;
第四计算单元,用于计算所述第二分数总和与所述第一权重的第一乘积,计算所述第三分数总和与所述第二权重的第二乘积,将所述第一乘积与第二乘积的和值作为所述词语得分。
依据本发明第三方面,提供了一种设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。
依据本发明第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第二方面所述的方法的步骤。
借由上述技术方案,本发明提供的一种推荐词展示方法、装置、设备及计算机可读存储介质,与目前采用推荐词排序算法对推荐词进行排序,并按照排序结果展示一定数量的推荐词的方式相比,本发明根据用户当前的环境参数获取至少一个推荐词,并基于推荐词打分模型对至少一个推荐词进行打分,从而在至少一个推荐词中提取目标推荐词进行展示,使得在不同的场景中为用户确定的推荐词是不同的,并不是完全根据用户的历史行为确定的,为高质量的推荐词提供了展示的机会,提高推荐词的价值,搜索效果更加理想。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种推荐词展示方法流程示意图;
图2A示出了本发明实施例提供的一种推荐词展示方法流程示意图;
图2B示出了本发明实施例提供的一种推荐词展示方法流程示意图;
图3A示出了本发明实施例提供的一种推荐词展示装置的结构示意图;
图3B示出了本发明实施例提供的一种推荐词展示装置的结构示意图;
图3C示出了本发明实施例提供的一种推荐词展示装置的结构示意图;
图3D示出了本发明实施例提供的一种推荐词展示装置的结构示意图;
图3E示出了本发明实施例提供的一种推荐词展示装置的结构示意图;
图4示出了本发明实施例提供的一种设备的装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种推荐词展示方法,可以根据用户当前的环境参数获取至少一个推荐词,并基于推荐词打分模型对至少一个推荐词进行打分,从而在至少一个推荐词中提取目标推荐词进行展示,使得在不同的场景中为用户确定的推荐词是不同的,并不是完全根据用户的历史行为确定的,达到了为高质量的推荐词提供了展示的机会,提高推荐词的价值,搜索效果更加理想的目的,如图1所示,该方法包括:
101、根据用户当前的环境参数,获取至少一个推荐词,环境参数至少包括位置信息和时间信息。
102、基于推荐词打分模型,对至少一个推荐词进行打分,得到至少一个推荐词的词语得分,推荐词打分模型根据用户对推荐词的历史点击行为建立。
103、在至少一个推荐词中提取目标推荐词,并展示目标推荐词,目标推荐词的词语得分符合推荐标准。
本发明实施例提供的方法,可以根据用户当前的环境参数获取至少一个推荐词,并基于推荐词打分模型对至少一个推荐词进行打分,从而在至少一个推荐词中提取目标推荐词进行展示,使得在不同的场景中为用户确定的推荐词是不同的,并不是完全根据用户的历史行为确定的,为高质量的推荐词提供了展示的机会,提高推荐词的价值,搜索效果更加理想。
本发明实施例提供了一种推荐词展示方法,可以根据用户当前的环境参数获取至少一个推荐词,并基于推荐词打分模型对至少一个推荐词进行打分,从而在至少一个推荐词中提取目标推荐词进行展示,使得在不同的场景中为用户确定的推荐词是不同的,并不是完全根据用户的历史行为确定的,达到了为高质量的推荐词提供了展示的机会,提高推荐词的价值,搜索效果更加理想的目的,如图2A所示,该方法包括:
201、建立推荐词打分模型。
发明人认识到,目前在对用户进行词语推荐时,通常采用推荐词排序算法,根据统计到的词语特征对推荐词进行排序,从而实现推荐,这对于高频的推荐词来说具有一定的效果,但是对于低频的推荐词而言,其词语特征较为稀疏,导致无法将高质量且特征稀疏的推荐词透出,而高频的推荐词由于依靠统计特征进行线性加权打分,人工经验无法较好的去衡量不同词语特征的重要度和权重,对于最后的排序分计算存在一定的偏颇,使得推荐词的效果不甚理想。因此,本发明提出了一种推荐词的展示方法,主要包括离线预测和在线读取两个部分,在离线预测中根据用户的历史行为训练推荐词打分模型,并基于在线读取的过程,利用推荐词打分模型对根据用户当前所处场景召回的推荐词进行打分和提取,最终基于在线读取来展示确定的目标推荐词,从而为高质量且特征稀疏的推荐词提供展示的机会。
由于推荐词的基本功能是为了根据用户的喜好来进行推荐,因此,针对不同的用户,可以根据该用户的历史行为为用户建立专属的推荐词打分模型。具体建立推荐词打分模型可以基于机器学习平台进行训练,训练得到的推荐词打分模型可为二分类模型,训练过程如下:首先,根据用户对推荐词的历史点击行为,获取样本推荐词以及样本推荐词的点击频次,并统计样本推荐词的展示次数,计算点击频次与展示次数的比值作为样本推荐词的点击率。例如,设根据用户的历史点击行为获取到的样本推荐词为A和B,A的点击频次为5次,展示次数为10次;B的点击频次为4次,展示次数为10次,则可以计算得到A的点击率为5/10=0.5,B的点击率为4/10=0.4。随后,提取样本推荐词的多个词语特征,计算多个词语特征中每个词语特征的平均点击率作为特征分数。其中,在提取词语特征时,可以将样本推荐词的词语属性、词语归属地、词语相关产品、词语相关品牌等作为词语特征。例如,设样本推荐词为“火锅”,则可将“四川”、“麻辣”等作为该样本推荐词的词语特征。最后,分别将多个词语特征与对应的特征分数进行组合,建立推荐词打分模型。
需要说明的是,为了提高推荐词的精确度,在获取样本推荐词时,不仅可以获取用户点击的词语作为样本推荐词,还可以获取已经展示,但是用户没有点击的词语也作为样本推荐词,并将用户点击过的词语作为正样本,将用户没有点击过的词语作为负样本,控制正负样本的比例为1:4,从而在后续基于负样本将用户不感兴趣的推荐词过滤掉,提高推荐的准确性。
另外,考虑到有些用户在空闲时间可能会随意点击访问推荐词,并不是按照自身的喜好选择访问的推荐词,因此,需要将用户的高频行为过滤掉,避免高频行为对整体效果造成影响。例如,可将日搜索量达到1000或1000以上的行为界定为高频行为。
202、对用户当前所处场景进行定位,确定用户的位置信息,获取在预设历史天数内与位置信息相关的多个候选推荐词。
在本发明实施例中,当根据用户的历史行为为用户建立了推荐词打分模型后,便可以确定与用户当前所处场景的位置和时间相关的至少一个推荐词,并基于该推荐词打分模型对至少一个推荐词进行打分,从而将分数高的推荐词推荐给用户。
在确定至少一个推荐词时,如果向用户推荐的推荐词所涉及的商品、店铺、相关信息等与用户当前所在的位置并不相关或者距离较远,则这种推荐词对于用户来说是毫无疑义的,并没有给用户带来有价值的引导,因此,需要根据用户当前所处的场景来收集推荐词,从而保证后续确定的目标推荐词一定是用户当前能够用得上的。
这样,便可以首先对用户当前所处场景进行定位,确定用户的位置信息,其中,可以采用经纬度的形式来表示用户的位置信息,或者将经纬度编码为GeoHash(经纬度字符串)。随后,考虑到有些推荐词是具有时效性的,比如有些商品只在固定时间内提供,过了该固定时间,该商品就会下架,因此,需要获取在预设历史天数内与位置信息相关的多个候选推荐词。具体地,可以查询位置信息在预设历史天数内发生的交易行为和点击行为,并在交易行为涉及的交易账单中提取交易店铺名称、交易店铺类目以及交易店铺商圈作为第一候选词,在点击行为涉及的点击数据中提取包括点击店铺名称、点击店铺类目以及点击店铺商圈作为第二候选词,第二候选词,进而将第一候选词和第二候选词作为多个候选推荐词。例如,假设预设历史天数为15天,则可在历史上15天的交易行为和点击行为中提取多个候选推荐词。
203、确定当前的时间信息,根据时间信息所在的目标时间段,对多个候选推荐词进行筛选,得到至少一个推荐词。
在本发明实施例中,考虑到有些店铺只在夜晚营业,或者有些商品在夜晚可能会售罄,因此,需要根据当前的时间信息来确定此时仍旧生效的至少一个推荐词。具体地,首先,确定当前的时间信息,并确定时间信息所在的目标时间段。其中,可将一天离散化为多个时间段,并通过时间段对多个候选推荐词进行筛选。例如,可将一天离散化为早时间段、午时间段、傍晚时间段、夜晚时间段以及凌晨时间段。通常来说可以划分为1至5中任一数目个时间段,本发明实施例对划分的时间段个数不进行具体限定。随后,根据当前的时间信息所在的目标时间段,对多个候选推荐词进行筛选,得到至少一个推荐词。例如,设当前的时间信息所在的目标时间段为早时间段,则将早时间段发生的交易行为和点击行为对应的候选推荐词作为至少一个推荐词。
204、基于推荐词打分模型,对至少一个推荐词进行打分,得到至少一个推荐词的词语得分。
在本发明实施例中,当确定了至少一个推荐词后,由于推荐词打分模型是根据用户对推荐词的历史点击行为建立的,因此,可以基于推荐词打分模型,对至少一个推荐词进行打分,进而根据得到的至少一个推荐词的词语得分来为用户进行词语推荐。
具体地,对于至少一个推荐词中的每个推荐词,基于推荐词打分模型,提取推荐词的至少一个待打分词语特征。提取待打分词语特征的过程与上述步骤201中所示的提取样本推荐词的词语特征的过程一致,此处不再进行赘述。随后,由于推荐词打分模型中为每一个词语特征都设置了对应的特征分数,因此,获取至少一个待打分词语特征在推荐词打分模型中对应的至少一个特征分数,计算至少一个特征分数的第一分数总和作为词语得分,并重复执行上述生成词语得分的过程,得到至少一个推荐词的词语得分。
需要说明的是,由于用户的环境参数所指示的当前所处场景也是具有环境特征的,例如,美食广场会提供大量的餐饮店铺,电脑城会提供大量的设备店铺等,而来到该场景的用户可能更加希望获取到与该场景的关系更加紧密的推荐词,因此,还可以提取环境参数的环境特征,从而统计环境特征与词语特征相同部分的交叉特征,并将该交叉特征也作为对推荐词进行打分的一部分。其中,环境特征可以理解为商圈特征或者功能特征,也即能够描述环境参数所指示的用户当前所处场景具有的主要功能的特征。具体地,提取环境参数的环境特征,可将环境参数指示的场景包括的店铺的特征或者店铺中发生的订单的特征或者场景的商圈特征或者场景的功能特征等作为环境特征。如果至少一个待打分词语特征中存在与环境特征相同的交叉特征,则获取第一权重和第二权重,计算至少一个待打分词语特征中除交叉特征外的其他待打分词语特征的特征分数的第二分数总和,并计算交叉特征的特征分数的第三分数总和。最后,计算第二分数总和与第一权重的第一乘积,计算第三分数总和与第二权重的第二乘积,将第一乘积与第二乘积的和值作为词语得分。例如,假设至少一个待打分词语特征包括W、X、Y、Z,其中,W和Z为交叉特征,W对应的特征分数为0.9,X对应的特征分数为0.2,Y对应的特征分数为0.7,Z对应的特征分数为0.9,第一权重和第二权重均为50%,则可计算得到第一乘积为(0.2+0.7)×50%=0.45,计算得到的第二乘积为(0.9+0.9)×50%=0.9,进而计算得到的词语得分为0.45+0.9=1.35。
205、在至少一个推荐词中提取目标推荐词,并展示目标推荐词。
在本发明实施例中,通过上述过程便可以计算得到至少一个推荐词中每个推荐词的词语得分。考虑到每次为用户推荐的推荐词个数是有限的,如果大量的向用户推荐很可能造成用户的方案,因此,需要在至少一个推荐词中提取词语得分符合推荐标准的目标推荐词,并展示该目标推荐词。其中,为了筛选得到目标推荐词,可以设置一个分数阈值,并将词语得分大于等于该分数阈值的全部推荐词都作为目标推荐词。例如,设置的分数阈值可为0.9分,则将词语得分大于0.9分的全部推荐词都作为目标推荐词。
在实际应用的过程中,还可以设置个数阈值,也即将个数阈值的词语得分最大的推荐词作为目标推荐词。例如,假设按照词语得分从大到小排序后的推荐词为X、Y、Z、W,个数阈值为2个,则可将X和Y作为目标推荐词进行推荐。
在实际应用的过程中,整个推荐词展示流程可以概括如下:参见图2B,在离线预测中,抽取样本推荐词,对样本推荐词进行特征提取,根据提取到的词语特征训练词语打分模型。之后,根据用户当前的环境参数确定至少一个推荐词,将推荐词进行特征提取后,采用训练模型对提取到的特征进行预测,从而对至少一个推荐词进行打分和排序,确定目标推荐词。最后,将目标推荐词返回给在线读取进行展示。
本发明提供的方法,根据用户当前的环境参数获取至少一个推荐词,并基于推荐词打分模型对至少一个推荐词进行打分,从而在至少一个推荐词中提取目标推荐词进行展示,使得在不同的场景中为用户确定的推荐词是不同的,并不是完全根据用户的历史行为确定的,为高质量的推荐词提供了展示的机会,提高推荐词的价值,搜索效果更加理想。
进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种推荐词展示装置,如图3A所示,所述装置包括:第一获取模块301,打分模块302和展示模块303。
该第一获取模块301,用于根据用户当前的环境参数,获取至少一个推荐词,所述环境参数至少包括位置信息和时间信息;
该打分模块302,用于基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分,所述推荐词打分模型根据所述用户对推荐词的历史点击行为建立;
该展示模块303,用于在所述至少一个推荐词中提取目标推荐词,并展示所述目标推荐词,所述目标推荐词的词语得分符合推荐标准。
在具体的应用场景中,如图3B所示,该装置包括:第二获取模块304,统计模块305,提取模块306和建立模块307。
该第二获取模块304,用于根据所述用户对推荐词的历史点击行为,获取样本推荐词以及所述样本推荐词的点击频次;
该统计模块305,用于统计所述样本推荐词的展示次数,计算所述点击频次与所述展示次数的比值作为所述样本推荐词的点击率;
该提取模块306,用于提取所述样本推荐词的多个词语特征,计算所述多个词语特征中每个词语特征的平均点击率作为特征分数;
该建立模块307,用于分别将所述多个词语特征与对应的特征分数进行组合,建立所述推荐词打分模型。
在具体的应用场景中,如图3C所示,该第一获取模块301,包括:定位单元3011和确定单元3012。
该定位单元3011,用于对所述用户当前所处场景进行定位,确定所述位置信息,获取在预设历史天数内与所述位置信息相关的多个候选推荐词;
该确定单元3012,用于确定当前的所述时间信息,根据所述时间信息所在的目标时间段,对所述多个候选推荐词进行筛选,得到所述至少一个推荐词。
在具体的应用场景中,该定位单元3011,用于查询所述位置信息在所述预设历史天数内发生的交易行为和点击行为;在所述交易行为涉及的交易账单中提取第一候选词,所述第一候选词至少包括交易店铺名称、交易店铺类目以及交易店铺商圈;在所述点击行为涉及的点击数据中提取第二候选词,所述第二候选词至少包括点击店铺名称、点击店铺类目以及点击店铺商圈;将所述第一候选词和所述第二候选词作为所述多个候选推荐词。
在具体的应用场景中,如图3D所示,该打分模块302,包括:第一提取单元3021,第一获取单元3022,第一计算单元3023。
该第一提取单元3021,用于对于所述至少一个推荐词中的每个推荐词,基于所述推荐词打分模型,提取所述推荐词的至少一个待打分词语特征;
该第一获取单元3022,用于获取所述至少一个待打分词语特征在所述推荐词打分模型中对应的至少一个特征分数;
该第一计算单元3023,用于计算所述至少一个特征分数的第一分数总和作为所述词语得分;
该第一提取单元3021,还用于重复执行上述生成词语得分的过程,得到所述至少一个推荐词的词语得分。
在具体的应用场景中,如图3E所示,该打分模块302,还包括:第二提取单元3024,第二获取单元3025,第二计算单元3026,第三计算单元3027和第四计算单元3028。
该第二提取单元3024,用于提取所述环境参数的环境特征;
该第二获取单元3025,用于如果所述至少一个待打分词语特征中存在与所述环境特征相同的交叉特征,则获取第一权重和第二权重;
该第二计算单元3026,用于计算所述至少一个待打分词语特征中除交叉特征外的其他待打分词语特征的特征分数的第二分数总和;
该第三计算单元3027,用于计算所述交叉特征的特征分数的第三分数总和;
该第四计算单元3028,用于计算所述第二分数总和与所述第一权重的第一乘积,计算所述第三分数总和与所述第二权重的第二乘积,将所述第一乘积与第二乘积的和值作为所述词语得分。
本发明实施例提供的装置,可以根据用户当前的环境参数获取至少一个推荐词,并基于推荐词打分模型对至少一个推荐词进行打分,从而在至少一个推荐词中提取目标推荐词进行展示,使得在不同的场景中为用户确定的推荐词是不同的,并不是完全根据用户的历史行为确定的,为高质量的推荐词提供了展示的机会,提高推荐词的价值,搜索效果更加理想。
需要说明的是,本发明实施例提供的一种推荐词展示方装置所涉及各功能单元的其他相应描述,可以参考图1和图2A至图2B中的对应描述,在此不再赘述。
在示例性实施例中,参见图4,还提供了一种设备,该设备400包括通信总线、处理器、存储器和通信接口,还可以包括、输入输出接口和显示设备,其中,各个功能单元之间可以通过总线完成相互间的通信。该存储器存储有计算机程序,处理器,用于执行存储器上所存放的程序,执行上述实施例中的推荐词展示方方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的推荐词展示方方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种推荐词展示方法,其特征在于,包括:
根据用户当前的环境参数,获取至少一个推荐词,所述环境参数至少包括位置信息和时间信息;
基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分,所述推荐词打分模型根据所述用户对推荐词的历史点击行为建立;
在所述至少一个推荐词中提取目标推荐词,并展示所述目标推荐词,所述目标推荐词的词语得分符合推荐标准。
2.根据权利要求1所述的方法,其特征在于,所述根据用户当前的环境参数,获取至少一个推荐词之前,所述方法包括:
根据所述用户对推荐词的历史点击行为,获取样本推荐词以及所述样本推荐词的点击频次;
统计所述样本推荐词的展示次数,计算所述点击频次与所述展示次数的比值作为所述样本推荐词的点击率;
提取所述样本推荐词的多个词语特征,计算所述多个词语特征中每个词语特征的平均点击率作为特征分数;
分别将所述多个词语特征与对应的特征分数进行组合,建立所述推荐词打分模型。
3.根据权利要求1所述的方法,其特征在于,所述根据用户当前的环境参数,获取至少一个推荐词,包括:
对所述用户当前所处场景进行定位,确定所述位置信息,获取在预设历史天数内与所述位置信息相关的多个候选推荐词;
确定当前的所述时间信息,根据所述时间信息所在的目标时间段,对所述多个候选推荐词进行筛选,得到所述至少一个推荐词。
4.根据权利要求3所述的方法,其特征在于,所述获取在预设历史天数内与所述位置信息相关的多个候选推荐词,包括:
查询所述位置信息在所述预设历史天数内发生的交易行为和点击行为;
在所述交易行为涉及的交易账单中提取第一候选词,所述第一候选词至少包括交易店铺名称、交易店铺类目以及交易店铺商圈;
在所述点击行为涉及的点击数据中提取第二候选词,所述第二候选词至少包括点击店铺名称、点击店铺类目以及点击店铺商圈;
将所述第一候选词和所述第二候选词作为所述多个候选推荐词。
5.根据权利要求1所述的方法,其特征在于,所述基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分,包括:
对于所述至少一个推荐词中的每个推荐词,基于所述推荐词打分模型,提取所述推荐词的至少一个待打分词语特征;
获取所述至少一个待打分词语特征在所述推荐词打分模型中对应的至少一个特征分数;
计算所述至少一个特征分数的第一分数总和作为所述词语得分;
重复执行上述生成词语得分的过程,得到所述至少一个推荐词的词语得分。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
提取所述环境参数的环境特征;
如果所述至少一个待打分词语特征中存在与所述环境特征相同的交叉特征,则获取第一权重和第二权重;
计算所述至少一个待打分词语特征中除交叉特征外的其他待打分词语特征的特征分数的第二分数总和;
计算所述交叉特征的特征分数的第三分数总和;
计算所述第二分数总和与所述第一权重的第一乘积,计算所述第三分数总和与所述第二权重的第二乘积,将所述第一乘积与第二乘积的和值作为所述词语得分。
7.一种推荐词展示装置,其特征在于,包括:
第一获取模块,用于根据用户当前的环境参数,获取至少一个推荐词,所述环境参数至少包括位置信息和时间信息;
打分模块,用于基于推荐词打分模型,对所述至少一个推荐词进行打分,得到所述至少一个推荐词的词语得分,所述推荐词打分模型根据所述用户对推荐词的历史点击行为建立;
展示模块,用于在所述至少一个推荐词中提取目标推荐词,并展示所述目标推荐词,所述目标推荐词的词语得分符合推荐标准。
8.根据权利要求7所述的装置,其特征在于,所述装置包括:
第二获取模块,用于根据所述用户对推荐词的历史点击行为,获取样本推荐词以及所述样本推荐词的点击频次;
统计模块,用于统计所述样本推荐词的展示次数,计算所述点击频次与所述展示次数的比值作为所述样本推荐词的点击率;
提取模块,用于提取所述样本推荐词的多个词语特征,计算所述多个词语特征中每个词语特征的平均点击率作为特征分数;
建立模块,用于分别将所述多个词语特征与对应的特征分数进行组合,建立所述推荐词打分模型。
9.一种设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201910656435.4A 2019-07-19 2019-07-19 推荐词展示方法、装置、设备及计算机可读存储介质 Active CN110532351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910656435.4A CN110532351B (zh) 2019-07-19 2019-07-19 推荐词展示方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910656435.4A CN110532351B (zh) 2019-07-19 2019-07-19 推荐词展示方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110532351A true CN110532351A (zh) 2019-12-03
CN110532351B CN110532351B (zh) 2022-04-12

Family

ID=68661738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910656435.4A Active CN110532351B (zh) 2019-07-19 2019-07-19 推荐词展示方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110532351B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444430A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备和存储介质
CN111445282A (zh) * 2020-03-20 2020-07-24 支付宝(杭州)信息技术有限公司 基于用户行为的业务处理方法、装置及设备
CN111625680A (zh) * 2020-05-15 2020-09-04 青岛聚看云科技有限公司 确定搜索结果的方法及装置
CN111737574A (zh) * 2020-06-19 2020-10-02 口口相传(北京)网络技术有限公司 搜索信息获取方法、装置、计算机设备及可读存储介质
CN111737595A (zh) * 2020-06-24 2020-10-02 支付宝(杭州)信息技术有限公司 一种候选词推荐方法、词库排序模型训练方法及装置
CN112596617A (zh) * 2020-12-25 2021-04-02 维沃移动通信有限公司 消息内容的输入方法、装置和电子设备
CN114238705A (zh) * 2020-09-09 2022-03-25 北京搜狗科技发展有限公司 一种相关搜索推荐方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN104166700A (zh) * 2014-08-01 2014-11-26 百度在线网络技术(北京)有限公司 搜索词推荐方法及装置
KR20150022583A (ko) * 2013-08-23 2015-03-04 주식회사 케이티 키워드를 추출하는 장치 및 방법
CN106202260A (zh) * 2016-06-29 2016-12-07 百度在线网络技术(北京)有限公司 搜索方法、装置和搜索引擎
CN107798066A (zh) * 2017-09-25 2018-03-13 北京小度信息科技有限公司 一种搜索词推送方法、装置及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
KR20150022583A (ko) * 2013-08-23 2015-03-04 주식회사 케이티 키워드를 추출하는 장치 및 방법
CN104166700A (zh) * 2014-08-01 2014-11-26 百度在线网络技术(北京)有限公司 搜索词推荐方法及装置
CN106202260A (zh) * 2016-06-29 2016-12-07 百度在线网络技术(北京)有限公司 搜索方法、装置和搜索引擎
CN107798066A (zh) * 2017-09-25 2018-03-13 北京小度信息科技有限公司 一种搜索词推送方法、装置及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
崔琰: "基于用户兴趣及术语关系的查询扩展方法", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111445282A (zh) * 2020-03-20 2020-07-24 支付宝(杭州)信息技术有限公司 基于用户行为的业务处理方法、装置及设备
CN111445282B (zh) * 2020-03-20 2023-02-10 支付宝(杭州)信息技术有限公司 基于用户行为的业务处理方法、装置及设备
CN111444430A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备和存储介质
CN111444430B (zh) * 2020-03-30 2022-09-27 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备和存储介质
CN111625680A (zh) * 2020-05-15 2020-09-04 青岛聚看云科技有限公司 确定搜索结果的方法及装置
CN111625680B (zh) * 2020-05-15 2023-08-25 青岛聚看云科技有限公司 确定搜索结果的方法及装置
CN111737574A (zh) * 2020-06-19 2020-10-02 口口相传(北京)网络技术有限公司 搜索信息获取方法、装置、计算机设备及可读存储介质
CN111737574B (zh) * 2020-06-19 2024-01-26 口口相传(北京)网络技术有限公司 搜索信息获取方法、装置、计算机设备及可读存储介质
CN111737595A (zh) * 2020-06-24 2020-10-02 支付宝(杭州)信息技术有限公司 一种候选词推荐方法、词库排序模型训练方法及装置
CN111737595B (zh) * 2020-06-24 2024-02-06 支付宝(杭州)信息技术有限公司 一种候选词推荐方法、词库排序模型训练方法及装置
CN114238705A (zh) * 2020-09-09 2022-03-25 北京搜狗科技发展有限公司 一种相关搜索推荐方法、装置及电子设备
CN112596617A (zh) * 2020-12-25 2021-04-02 维沃移动通信有限公司 消息内容的输入方法、装置和电子设备

Also Published As

Publication number Publication date
CN110532351B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN110532351A (zh) 推荐词展示方法、装置、设备及计算机可读存储介质
CN105224699B (zh) 一种新闻推荐方法及装置
CN111444394B (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
EP3623956A1 (en) Method and apparatus for obtaining recommendation information, and electronic device
CN105574025B (zh) 用于计算排序分及建立模型的方法、装置及商品推荐系统
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
EP3617952A1 (en) Information search method, apparatus and system
CN106126582A (zh) 推荐方法及装置
CN105447730A (zh) 目标用户定向方法及装置
CN112612957B (zh) 兴趣点的推荐方法、兴趣点推荐模型的训练方法、装置
CN110427560A (zh) 一种应用于推荐系统的模型训练方法以及相关装置
CN106372249A (zh) 一种点击率预估方法、装置及电子设备
CN109460519B (zh) 浏览对象推荐方法及装置、存储介质、服务器
CN105373597A (zh) 基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法
CN111028016A (zh) 销量数据预测方法、装置以及相关设备
CN104102719A (zh) 一种轨迹信息的推送方法及装置
CN106777282B (zh) 相关搜索的排序方法和装置
CN111461841A (zh) 物品推荐方法、装置、服务器及存储介质
CN113254810B (zh) 搜索结果输出方法、装置、计算机设备及可读存储介质
CN110287307A (zh) 一种搜索结果排序方法、装置及服务器
CN108415960A (zh) 一种地理位置服务的实现方法及装置,电子设备
CN113627995A (zh) 商品推荐列表更新方法及其装置、设备、介质、产品
CN115712780A (zh) 一种基于云计算和大数据的信息推送方法及装置
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质
CN111563207B (zh) 一种搜索结果的排序方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant