CN113505281B - 搜索建议词生成方法、装置、电子设备及可读存储介质 - Google Patents

搜索建议词生成方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN113505281B
CN113505281B CN202110663574.7A CN202110663574A CN113505281B CN 113505281 B CN113505281 B CN 113505281B CN 202110663574 A CN202110663574 A CN 202110663574A CN 113505281 B CN113505281 B CN 113505281B
Authority
CN
China
Prior art keywords
word
preset
category
words
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110663574.7A
Other languages
English (en)
Other versions
CN113505281A (zh
Inventor
赵领杰
陈达遥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202110663574.7A priority Critical patent/CN113505281B/zh
Publication of CN113505281A publication Critical patent/CN113505281A/zh
Application granted granted Critical
Publication of CN113505281B publication Critical patent/CN113505281B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种搜索建议词生成方法、装置、电子设备及可读存储介质,该方法中,获取搜索词命中的预设标准词,以作为候选建议词。对于任一候选建议词,确定候选建议词对应的价值分值。基于价值分值,从候选建议词中为搜索词选择目标建议词。相较于直接选择历史搜索词的方式,这样,基于与第一数量正相关的价值分值选择目标建议词,一定程度上可以确保最终以选择的目标建议词搜索时,能够为用户提供较为充足的供给,进而确保建议词的搜索效果。同时,可以使得未被搜索过的词语也有机会被推荐给用户,进而提高建议词的推荐范围以及增大建议词所命中的网络对象的范围。

Description

搜索建议词生成方法、装置、电子设备及可读存储介质
技术领域
本发明属于网络技术领域,特别是涉及一种搜索建议词生成方法、装置、电子设备及可读存储介质。
背景技术
随着网络技术的不断发展,网络平台上提供的网络对象的数量越来越多。如何方便用户对网络平台提供的网络对象进行搜索,成为人们广泛关注的问题。
相关技术中,往往是获取该用户使用过的历史搜索词,在用户进行搜索时,从历史搜索词中为用户选择搜索建议词,以提高用户的搜索效率。这种方式中,搜索建议词的覆盖范围较小且搜索建议词的搜索效果有时会较差。
发明内容
本发明提供一种搜索建议词生成方法、装置、电子设备及可读存储介质,以便解决搜索建议词的覆盖范围较小且搜索建议词的搜索效果有时会较差的问题。
第一方面,本发明提供一种搜索建议词生成方法,所述方法包括:
获取搜索词命中的预设标准词,以作为候选建议词;所述预设标准词是根据预设类别组合构建的,所述预设标注词中各分词对应的类别属于所述预设类别组合;
对于任一所述候选建议词,确定所述候选建议词对应的价值分值;所述价值分值与所述候选建议词命中的网络对象的第一数量正相关;
基于所述价值分值,从所述候选建议词中为所述搜索词选择目标建议词。
第二方面,本发明提供一种建议词生成装置,所述装置包括:
第一获取模块,用于获取搜索词命中的预设标准词,以作为候选建议词;所述预设标准词是根据预设类别组合构建的,所述预设标注词中各分词对应的类别属于所述预设类别组合;
第一确定模块,用于对于任一所述候选建议词,确定所述候选建议词对应的价值分值;所述价值分值与所述候选建议词命中的网络对象的第一数量正相关;
选择块,用于基于所述价值分值,从所述候选建议词中为所述搜索词选择目标建议词。
第三方面,本发明提供一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述搜索建议词生成方法。
第四方面,本发明提供一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述搜索建议词生成方法。
本发明实施例提供的搜索建议词生成方法,通过获取搜索词命中的预设标准词,以作为候选建议词,预设标准词是根据预设类别组合构建的,预设标注词中各分词对应的类别属于预设类别组合。对于任一候选建议词,确定候选建议词对应的价值分值。价值分值与候选建议词命中的网络对象的第一数量正相关。基于价值分值,从候选建议词中为搜索词选择目标建议词。相较于直接选择历史搜索词的方式,本发明实施例中,基于与第一数量正相关的价值分值选择目标建议词,一定程度上可以确保最终以选择的目标建议词搜索时,能够为用户提供较为充足的供给,进而确保建议词的搜索效果。同时,根据预设类别组合构建的预设标准词的覆盖面往往大于历史搜索词的覆盖面。因此,本发明实施例中基于预设标准词选择目标建议词的方式,一定程度上可以使得未被搜索过的词语也有机会被推荐给用户,进而提高建议词的推荐范围以及增大建议词所命中的网络对象的范围。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种搜索建议词生成方法的步骤流程图;
图2是本发明实施例提供的一种生成过程示意图;
图3是本发明实施例提供的一种搜索建议词生成装置的结构图;
图4是本发明实施例提供的一种电子设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种搜索建议词生成方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、获取搜索词命中的预设标准词,以作为候选建议词;所述预设标准词是根据预设类别组合构建的,所述预设标注词中各分词对应的类别属于所述预设类别组合。
本发明实施例中,搜索词可以是一个或多个字符组成的词语,字符可以为汉字、英文、数字等字符。具体的,该搜索词可以是根据用户输入的搜索信息确定的。示例的,搜索信息可以是用户手动键入的文本,也可以是录入的语音,或者,还可以是上传的图片,本发明实施例对此不做限制。相应地,可以将文本表征的词语作为搜索词,将语音信息转换为文本,进而得到搜索词,或者,对上传的图片进行字符识别,将识别到的字符所组成的词语作为搜索词。
进一步地,预设类别组合可以是实际搜索场景中会使用到的搜索关键词中各分词对应的类别的组合。预设类别组合中包含的类别可以为一个或多个,预设类别组合的数量也可以为多个,一个预设类别组合可以表征一种组合模式。对于一个预设类别组合而言,符合该预设类别组合的预设标准词可以为多个,该预设标准词中分词对应的类别与该预设类别组合中包含的类别相同,预设标准词中分词对应的类别的组合方式也可以与该预设类别组合中类别的组合方式相同。其中,分词对应的类别可以是该分词命中的网络对象所属的类别。示例的,假设预设类别组合为“景点类别”+“美食类别”,那么符合该预设类别组合的预设标准词可以为“南湖公园附近的火锅店”、“大雁塔附近的肉夹馍”、等等。相较于历史搜索词,符合预设类别组合的词语往往更多,即,根据预设类别组合构建的预设标准词的覆盖面往往大于历史搜索词的覆盖面,预设标准词整体所能命中的网络对象也会多于历史搜索词整体所能命中的网络对象。因此,本发明实施例中从预设标准词选择候选建议词,并在后续过程中从候选建议词中选择目标建议词的方式,一定程度上可以使得未被搜索过的词语也有机会被推荐给用户,进而提高建议词的推荐范围以及增大建议词所命中的网络对象的范围。
进一步地,候选建议词可以是包含该搜索词的预设标准词。具体实施时,可以检测预设标准词库中的各预设标准词是否包含该搜索词,如果包含,则可以将该预设标准词作为候选建议词。示例的,假设搜索词为A,那么可以将包含A的预设标准词,例如,ABX、BAX、CA,确定为候选建议词。
步骤102、对于任一所述候选建议词,确定所述候选建议词对应的价值分值;所述价值分值与所述候选建议词命中的网络对象的第一数量正相关。
本发明实施例中,第一数量是候选建议词在网络平台中命中的网络对象的数量。候选建议词在网络平台中命中的网络对象可以是对应的关键词与该候选建议词相匹配的网络对象。其中,网络平台可以为视频平台、视频平台、生活服务平台,例如,外卖平台、团购平台,等等。网络对象可以表示网络平台中的一个兴趣点(POI),示例的,网络对象可以为视频、音频、商品、服务等。如果候选建议词命中的网络对象的第一数量越大,则可以说明以该候选建议词进行搜索时,网络平台能为用户搜索出越多的网络对象,即,提供越丰富的搜索结果,供给较多。反之,如果候选建议词命中的网络对象的第一数量越小,则可以说明以该候选建议词进行搜索时,网络平台只能为用户搜索出较少的网络对象,即,提供的搜索结果较少,供给较少。因此,本发明实施例中,通过获取价值分值,可以便于后续根据价值分值衡量候选建议词所能提供的供给,从而方便对候选建议词进行选择。
步骤103、基于所述价值分值,从所述候选建议词中为所述搜索词选择目标建议词。
本发明实施例中,可以选择价值分值最高的前M个候选建议词作为目标建议词,并按照价值分值从高到低的顺序显示目标建议词。示例的,可以按照价值分值从高到低的顺序将目标建议词在搜索页面显示,例如,显示在用于输入搜索词的搜索框的下方。当然,在候选建议词的总数量不大于M 的情况下,可以直接将所有候选建议词作为目标建议词,假设候选建议词的模式为:第一类别+第二类别,当用户输入的搜索词为候选建议词中包含的第一类别词语时,网络平台可以将该候选建议词作为目标建议词并直接展示给用户,或者,按照价值分值从高到低的顺序,排序之后再显示。
本发明实施例提供的搜索建议词生成方法,通过获取搜索词命中的预设标准词,以作为候选建议词,预设标准词是根据预设类别组合构建的,预设标注词中各分词对应的类别属于预设类别组合。对于任一候选建议词,确定候选建议词对应的价值分值。价值分值与候选建议词命中的网络对象的第一数量正相关。基于价值分值,从候选建议词中为搜索词选择目标建议词。相较于直接选择历史搜索词的方式,本发明实施例中,基于与第一数量正相关的价值分值选择目标建议词,一定程度上可以确保最终以选择的目标建议词搜索时,能够为用户提供较为充足的供给,进而确保建议词的搜索效果。同时,根据预设类别组合构建的预设标准词的覆盖面往往大于历史搜索词的覆盖面。因此,本发明实施例中基于预设标准词选择目标建议词的方式,一定程度上可以使得未被搜索过的词语也有机会被推荐给用户,进而提高建议词的推荐范围以及增大建议词所命中的网络对象的范围。
可选的,本发明实施例中还可以包括下述步骤,以构造上述预设标准词:
步骤S21、根据网络平台中各网络对象所属的类别以及对应关键词,确定各类别下的关键词,得到备用关键词。
本发明实施例中,网络平台中各网络对象所属的类别以及对应关键词可以是预先为网络对象设置的。示例的,可以在预先建立供给标注环节,在该环节中,可以利用预设的类别体系进行类别标注。具体的,在用户向网络平台中注册网络对象时,例如,注册商户、商品时,可以提示用户人工填写网络对象对应的品类,即,网络对象所属的类别。然后由平台审核人员审核网络对象所属的类别。当然,也可以使用预设的分类模型,判断该网络对象所属的类别,本发明实施例对此不作限定。通过对网络平台中的所有网络对象执行标注操作,可以实现遍历网络平台的所有类别,自顶向下建立网络平台的各级品类。例如火锅店对应的各级品类可以为:美食->火锅->XX口味火锅。进一步地,该网络对象对应的关键词可以视为网络平台中的标准词,具体的,可以根据网络对象的相关信息,为网络对象设置能够表征该网络对象特点的关键词。例如,从网络对象的名称、简介、详情页等相关信息中抽取出现频率较高的词语,以作为关键词。
进一步地,对于网络平台中的所有网络对象,可以将所属的类别相同的网络对象分类至同一组,然后将同一组中网络对象对应所有关键词划分至该组中网络对象所属的类别,进而得到各类别下的关键词,所有的这些关键词可以组成备用关键词。
步骤S22、对于任一所述预设类别组合,从所述备用关键词中获取所述预设类别组合中各类别下的关键词,并进行组合,得到所述预设标准词。
本步骤中,可以通过穷举法,将预设类别组合中各类别下的关键词按照所有可能的组合方式,进行组合。示例的,在每次组合时,可以从预设类别组合的每个类别下的关键词中选取一个关键词。其中,每次选取出来的关键词的数量与该预设类别组合中包括的类别的数量相同。然后,将本次选取出来的关键词进行组合,得到1个预设标准词。通过多次选择即可得到多个预设标准词。
示例的,假设有预设类别组合1:“A类别+B类别”以及预设类别组合2:“D类别+E类别”,那么可以将A类别下关键词与B类别下的关键词进行两两组合,得到符合预设类别组合1的预设标准词。将D类别下关键词与E类别下的关键词进行两两组合,得到符合预设类别组合2的预设标准词。具体在进行组合时,可以是按照预设的组合模板进行组合,以确保组合后得到的预设标准词的语义更加自然流畅,从而确保后续选中预设标准词进行搜索时的搜索效果。示例的,对于关键词“香山公园”以及关键词“民宿”,可以组合得到预设标准词“香山公园附近民宿”。需要说明的是,实际应用中,也可以仅采用网络平台中特定网络对象所属的类别以及对应关键词,构造预设标准词。其中,特定网络对象可以是根据实际需求设置的,示例的,特定网络对象可以为网络平台中的景点。当然,也可以基于所有网络对象构造预设标准词,以更大程度的提升建议效果。
进一步地,本发明实施例中,按照预设类别组合对从网络平台中网络对象的关键词组合,一定程度上可以使得构造的预设标准词能够涉及到被搜索过以及未被用户搜索过的词,即,该预设类别组合构建的预设标准词可以包括历史搜索词以及非历史搜索词,从而确保预设标准词可以命中被搜索过的网络对象以及未被用户搜索过的网络对象,使得预设标准词可以满足用户未被发掘的需求。示例的,假设预设类别组合包括第一类别“景点”和第二类别“品类”,其中,第二类别“品类”可以具体包括网络平台中属于品类的多个具体类别,每个具体类别下包括网络对象。第一类别和第二类别下有一部分关键词是用户已经搜索过的,而很多关键词还未被用户搜索到,但是用户可能会有此类搜索需求。通过组合可以扩展到所有“景点”类别下的关键词和“品类”下的关键词,形成了“景点+品类”组合模式下的所有预设标准词。例如,第一类别下包括:颐和园、香山公园等等,第二类别下包括:美食、民宿等等。符合该预设类别组合的“颐和园周边美食”可能被搜索过,但是通过组合还可以得到未被搜索过的预设标准词“香山公园附近的民宿”。
同时,在网络平台中出现新的网络对象时,可以被基于预设标准词选择的目标建议词覆盖到,从而可以避免由于用户对新的网络对象没有认知导致的无法快速冷启动的问题。例如,在根据搜索词从预设标准词中选择的目标建议词命中新的网络对象的情况下,就可以增大新的网络对象被搜索的概率,从而为新的网络对象增加曝光度。
本发明实施例中,根据网络平台中各网络对象所属的类别以及对应关键词,确定各类别下的关键词,得到备用关键词。对于任一预设类别组合,从备用关键词中获取预设类别组合中各类别下的关键词,并进行组合,得到预设标准词。这样,可以使得构造的预设标准词更丰富以及确保预设标准词能够更全面的覆盖到网络平台中的网络对象,进而确保后续从这些预设标准词中选择的目标建议词的搜索效果。
可选的,本发明实施例中还可以包括下述步骤,以生成上述预设类别组合:
步骤S31、获取网络平台中的历史搜索词。
本步骤中,可以读取预先收集好的历史搜索词,以实现获取。其中,这些搜索词可以是网络平台中所有用户使用过的历史搜索词,以最大程度确保后续确定的预设类别组合足够全面,从而确保以预设类别组合构造的预设标准词的覆盖面。当然,也可以是先获取网络平台中的历史搜索记录,示例的,可以获取全部搜索记录,或者是预设时段内的搜索记录。然后对获取到的历史搜索记录进行解析,以确定网络平台中的历史搜索词。
步骤S31、对于网络平台中的任一历史搜索词,根据所述历史搜索词中各分词对应的类别,生成候选类别组合。
本发明实施例中,历史搜索词中包括的分词以及各分词对应的类别可以是在需求标注环节确定的。示例的,可以在该需求标注环节中,对各个历史搜索词进行分词处理,以得到该历史搜索词中包括的分词,然后为分词确定对应的类别。示例的,可以将该分词所表征的网络对象所属的类别,即所能命中的网络对象所属的类别,确定为该分词对应的类别。例如,历史搜索词“颐和园周边火锅”包括的分词可以为:颐和园、周边、火锅。其中,“颐和园”对应的类别为“景点”,“周边”为描述词,不存在对应的类别,“火锅”对应的类别为“美食”,那么相应地,可以根据需求标注结果进行模式挖掘,以统计各个历史搜索词中不同类别的共现关系,即,将类别进行组合得到候选类别组合,例如,可以得到:“景点”+“美食”。
步骤S32、根据所述候选类别组合,确定所述预设类别组合。
本步骤中,可以从候选类别组合中选择预设类别组合。
本发明实施例中,对于网络平台中的任一历史搜索词,根据历史搜索词中各分词对应的类别,生成候选类别组合,根据候选类别组合,确定预设类别组合。由于候选类别组合是通过已被搜索过的词语抽象得到的,因此,一定程度上可以确保最终生成的预设类别组合能够符合用户的搜索需求以及搜索习惯,从而确保以该预设类别组合构建的预设标准词符合用户的搜索需求以及搜索习惯。
同时,本发明实施例中先结合网络平台中的历史搜索词,挖掘出预设类别组合,然后基于预设类别组合扩展出大量的包括历史搜索词以及非历史搜索词的预设标准词,可以在进行搜索建议时,提供丰富的选择,避免可推荐的词仅局限于历史搜索词,从而一定程度可以通过预设标准词进一步挖掘之前用户没有搜索过的需求。
可选的,上述根据候选类别组合,确定预设类别组合的操作,可以通过下述步骤S41实现:
步骤S41、将所述候选类别组合直接确定为所述预设类别组合。
本步骤中,可以直接将挖掘的所有候选类别组合都确定为预设类别组合。这样,通过直接将候选类别组合确定为预设类别组合,一定程度上可以节省处理资源,提高确定预设类别组合的效率。同时,可以使得预设类别组合可以覆盖到挖掘的所有组合模式,从而最大程度确保基于预设类别组合构造的预设标准词的覆盖范围。
或者也可以通过下述步骤S42实现根据候选类别组合,确定预设类别组合:
步骤S42、统计所述候选类别组合中各类别对应的分词的第一出现次数,以及,所述候选类别组合的第二出现次数;将第一出现次数大于第一预设阈值且第二出现次数大于第二预设阈值的候选类别组合,确定为所述预设类别组合。
本步骤中可以根据前述需求标注的结果,获取候选类别组合中各类别对应的分词,然后统计这些分词在所有历史搜索词的分词中出现的次数,得到第一次数。然后,统计该候选类别组合在所有候选类别组合中的出现次数,得到第二出现次数。其中,第二出现次数可以表征符合该候选类别组合表征的共现关系的历史搜索词的个数,示例的,假设候选类别组合包括两个类别,那么第二出现次数可以表征两个类别下词两两出现的个数。
示例的,假设总共生成了100个候选类别组合:15个候选类别组合a、5个候选类别组合b、2个候选类别组合c、3个候选类别组合d、25个候选类别组合e以及50个候选类别组合f,即,候选类别组合a出现了15次,候选类别组合b出现了5次,候选类别组合c出现了2次,候选类别组合d 出现了3次,候选类别组合e出现了25次,候选类别组合f出现了50次。进一步地,如果该候选类别组合的第一出现次数大于第一预设阈值且第二出现次数大于第二预设阈值,则可以将该候选类别组合确定为预设类别组合。示例的,假设候选类别组合e以及候选类别组合f的第一出现次数大于第一预设阈值且第二出现次数大于第二预设阈值,则可以将候选类别组合e以及候选类别组合f确定为预设类别组合。反之,如果第一出现次数不大于第一预设阈值和/或第二出现次数不大于第二预设阈值,则可以删除这些候选类别组合。
本发明实施例中,统计候选类别组合中各类别对应的分词的第一出现次数,以及,候选类别组合的第二出现次数。将第一出现次数大于第一预设阈值且第二出现次数大于第二预设阈值的候选类别组合,确定为预设类别组合。这样,通过选择出现次数较多,即,在实际搜索场景中被使用频率较高的组合作为预设类别组合,一定程度上可以使得后续基于预设类别组合构建的预设标准词能够更加符合实际的搜索需求,从而确保从预设标准词中选择目标建议词的效果。
可选的,本发明实施例中,候选建议词的价值分值还可以与该候选建议词的被需求程度正相关。其中,候选建议词的被需求程度可以通过预设需求分值表征。相应地,上述确定所述候选建议词对应的价值分值的操作,可以通过下述步骤实现:
步骤S51、基于各所述预设标准词对应的预设需求分值以及预设供给分值,获取所述候选建议词对应的需求分值以及供给分值,得到目标需求分值以及目标供给分值;所述目标需求分值与所述候选建议词的被需求程度正相关,所述目标供给分值与所述第一数量正相关。
本步骤中,各个预设标准词对应的预设需求分值以及预设供给分值可以是预先计算好的。预设需求分值越高,则可以说明用户对该预设标准词的搜索需求越高,即,该预设标准词的被需求程度越高。预设供给分值越高,则可以说明该预设标准词命中的网络对象的数量越大,即,该预设标准词所能提供的供给越多。进一步地,通过从中查找与该候选建议词相同的预设标准词所对应的预设需求分值以及预设供给分值,即可得到目标需求分值以及目标供给分值。
步骤S52、根据所述目标需求分值以及所述目标供给分值,计算所述候选建议词对应的价值分值;所述价值分值与所述目标需求分值以及所述目标供给分值正相关。
根据目标需求分值以及目标供给分值,计算候选建议词对应的价值分值时,可以是计算目标需求分值与目标供给分值的乘积,以作为价值分值。或者,也可以是计算目标需求分值与目标供给分值之间的和值,以作为价值分值。又或者,也可以是根据预设权重,计算目标需求分值与目标供给分值的加权和。这样,仅通过执行复杂度较低的加法/乘法,即可实现计算价值分值,进而一定程度上可以确保计算效率。当然,也可以采用其他计算方式,本发明实施例对于具体的计算方式不做限制,只要确保采用的计算方式,可以满足在目标需求分值与目标供给分值越大时,计算得到的价值分值也会越大即可。
本发明实施例中,获取候选建议词对应的需求分值以及供给分值,得到目标需求分值以及目标供给分值,根据目标需求分值以及目标供给分值,计算候选建议词对应的价值分值。这样,通过在计算过程中同时结合能够表征候选建议词的被需求程度需求的需求分值以及能够表征候选建议词的供给情况的供给分值,一定程度上可以使得计算得到的价值分值能够更全面的衡量候选建议词,从而确保后续以价值分值作为选择依据时的选择效果。
同时,通过使用能够量化被需求程度的目标需求分值以及能够量化供给情况的目标供给分值,计算价值分值,一定程度上可以在贴近用户需求的同时,避免最终选出的目标建议词的搜索结果页中供给情况较差,搜索结果页中无搜索结果的问题。
需要说明的是,为了确保建议效果,还可以同时采用其他建议词生成方式生成补充建议词,然后采用排序模型对补充建议词进行排序,按照排序结果,将补充建议词以及目标建议词显示给用户。其中,补充建议词可以排在目标建议词之前显示。或者,也可以直接采用排序模型对补充建议词以及目标建议词进行排序,然后按照排序结果进行显示。
可选的,上述各预设标准词对应的预设供给分值,可以通过下述步骤预先确定:
步骤S61、对于任一所述预设标准词,确定所述第一数量以及所述预设标准词所命中地理区域内的网络对象的第二数量。
本步骤中,将该预设标准词中的各分词与网络平台中各网络对象的关键词进行比对,以确定关键词与该预设标准词中的分词相匹配的网络对象,接着,通过统计这些相匹配的网络对象的数量,得到第一数量。
进一步地,预设标准词所命中地理区域可以是该预设标准词中表征地理区域的分词所表征的地理区域。示例的,假设预设标准词为“香山公园附近的火锅”,那么预设标准词所命中地理区域可以为香山公园。当然,在预设标准词中不存在表征地理区域的分词的情况下,可以统计该预设标准词命中的各网络对象所处的地理区域,然后将出现次数最高的地理区域作为该预设标准词所命中的地理区域。进一步地,可以确定整个网络平台中位于该预设标准词所命中地理区域的网络对象的数量,进而得到第二数量。进一步地,为了提高第二数量的精确度,还可以是确定网络平台中位于该预设标准词所命中地理区域的网络对象中,属于目标品类的网络对象的数量,以作为第二数量。其中,目标品类可以是该预设标准词命中的网络对象所属品类中,出现次数最高的品类。其中,在确定属于目标品类的网络对象时,可以进一步结合前述供给标注环节中为各网络对象标注的品类。
在一种实现场景中,网络平台可以为生活服务平台。由于以预设标准词搜索时,可能会出现搜索结果页的搜索结果较差,例如,数量较少,进而可能会导致用户对于搜索服务的反馈较差。因此,本发明实施例中,可以结合构造的预设标准词以及网络平台中的网络对象,计算预设供给分值,以对预设标准词的供给情况进行量化。同时,由于生活服务平台本身的特殊性,构造的预设标准词往往是基于地理位置的,即,预设标准词中往往会存在一个类别对应的分词为表征地理区域的分词,因此,可以基于预设标注词,便捷的计算第二数量。需要说明的是,预设标准词中存在一个类别对应的分词为表征地理区域的分词的情况下,该预设标准词对应的第一数量可以是该预设标准词中第二类别词命中的网络对象的数量。其中,第二类别词对应的分词不表征地理区域。
步骤S62、计算所述第一数量与所述第二数量之间的第一比值,和/或,计算第一相对比值;所述第一相对比值是所述第一比值与词语比值之间的比值,所述词语比值为第一词语数量与所述预设标准词的总数量之间的比值,第一词语数量是与所述预设标准词对应的预设类别组合相匹配的预设标准词的数量。
具体的,可以只计算第一比值,或者只计算第一相对比值,或者,计算第一比值以及第一相对比值。计算第一比值的过程中,可以计算第一数量占第二数量的比例,即,计算第一数量/第二数量,得到第一比值。进一步地,计算第一相对比值的过程中,可以计算第一数量与第二数量之间的比值,得到第一比值。以及,计算词语比值。最后,计算第一比值占词语比值的比例,即,计算第一比值/词语比值,得到第一相对比值。其中,与该预设标准词对应的预设类别组合相匹配的预设标准词,可以是与该预设标准词命中的网络对象所属品类相同的预设标准词。即,词语比值可以表征所有预设标准词中属于该预设标准词对应的品类下的预设标准词,占所有预设标准词的比例。
步骤S63、根据所述第一比值和/或所述第一相对比值,计算所述预设供给分值;所述预设供给分值与所述第一比值以及所述第一相对比值正相关。
本步骤中,可以在仅计算了第一比值的情况下,可以将该第一比值确定为预设供给分值。在仅计算了第一相对比值的情况下,可以将该第一相对比值确定为预设供给分值。在计算了第一比值以及第一相对比值的情况下,可以根据第一比值以及第一相对比值计算点熵,以作为预设供给分值。示例的,可以计算log(第一相对比值)*第一比值,得到预设供给分值。当然,也可以采用其他计算方式,本发明实施例对此不作限定。
本发明实施例中,通过确定预设标准词的第一数量与该预设标准词所命中的地理范围内的网络对象的第二数量,根据第一数量与第二数量,统计第一比值和/或第一相对比值。最后,根据第一比值和/或第一相对比值,计算预设供给分值。由于第一比值以及第一相对比值可以更客观的表征该预设标准词所能提供的网络对象的供给情况,因此,一定程度上可以确保最终计算的预设供给分值可以较为精准表征预设标准词的供给情况,从而确保基于预设供给分值确定的价值分值的准确性。
可选的,上述各预设标准词对应的预设需求分值,可以通过下述步骤预先确定:
步骤S71、对于任一所述预设标准词,获取所述预设标准词的搜索次数。
实际应用场景中,用户往往是根据实际需求选择搜索时使用的词语,因此,本步骤中可以获取预设标准词的搜索次数,以衡量预设标准词的被需求程度。其中,预设标准词的被需求程度可以表示用户对该预设标准词命中的网络对象的需求程度。
步骤S72、计算所述搜索次数与第一展现次数之间的第二比值;所述第一展现次数是目标预设标准词的展现次数,所述目标预设标准词与所述预设标准词命中的触发词相同;和/或,计算第二相对比值;所述第二相对比值是所述第二比值与全局搜索比值之间的比值,所述全局搜索比值为所有预设标准词的搜索总次数与展现总次数之间的比值。
本步骤中,可以只计算第二比值,或者只计算第二相对比值,或者,计算第二比值以及第二相对比值。计算第二比值的过程中,可以计算搜索次数占第一展现次数的比例,即,计算搜索次数/第一展现次数,得到第二比值。其中,第一展现次数可以是该预设标准词的触发词下所有预设标注词的展现次数,展现次数可以指的是向用户展示的次数。预设标准词的触发词可以与预设标准词部分或全部相同的词语。第二比值可以表征该预设标准词在触发词下的搜索次数比例。
进一步地,计算第二相对比值的过程中,可以计算搜索次数与第一展现次数之间的比值,得到第二比值。以及,计算全局搜索比值。最后,计算第二比值占全局搜索比值的比例,即,计算第二比值/全局搜索比值,得到第二相对比值。其中,所有预设标准词的搜索总次数可以是所有预设标准词的搜索次数之和,展现总次数可以是所有预设标准词的展现次数之和。
步骤S73、根据所述第二比值和/或所述第二相对比值,计算所述预设需求分值;所述预设需求分值与所述第二比值以及所述第二相对比值正相关。
本步骤中,可以在仅计算了第二比值的情况下,可以将该第二比值确定为预设需求分值。在仅计算了第二相对比值的情况下,可以将该第二相对比值确定为预设需求分值。在计算了第二比值以及第二相对比值的情况下,可以根据第二比值以及第二相对比值计算点熵,以作为预设需求分值。示例的,可以计算log(第二相对比值)*第为比值,得到预设需求分值。当然,也可以采用其他计算方式,本发明实施例对此不作限定。
本发明实施例中,对于任一预设标准词,获取预设标准词的搜索次数。确定搜索次数与第一展现次数之间的第二比值,和/或,计算第二相对比值。根据第二比值和/或第二相对比值,计算预设需求分值。由于第二比值以及第二相对比值可以更客观的表征用户对该预设标准词的需求情况,因此,一定程度上可以确保最终计算的预设需求分值可以较为精准表征预设标准词的被需求情况,从而确保基于预设需求分值确定的价值分值的准确性。
可选的,由于预设标准词是根据预设类别组别构造的,因此预设标准词中会存在历史搜索词以及非历史搜索词。相应地,在预设标准词为历史搜索词的情况下,获取预设标准词的搜索次数的步骤,可以包括:将所述历史搜索词的历史搜索次数确定为所述搜索次数。具体的,可以获取网络平台的历史搜索记录,通过分析历史搜索记录,以确定与该预设标准词相匹配历史搜索词的历史搜索次数,进而得到该预设标准词的搜索次数。进一步地,在预设标准词不为历史搜索词的情况下,获取预设标准词的搜索次数的步骤,可以包括:在预设展示期内,在网络平台中对所述预设标准词进行展示;获取所述预设标准词在所述预设展示期内的搜索次数。具体的,可以在默认位置展示该预设标准词,以供用户搜索使用。其中,预设展示期可以是根据实际需求设置,示例的,预设展示期可以为1天,3天,一个星期,从当前时刻开始的每一天,等等。通过在预设展示期内展示,可以在收集到一定量的搜索历史之后,统计获取搜索次数。
本发明实施例中,对预设标准词中的历史搜索词,通过直接读取历史搜索次数,即可实现获取搜索次数的操作,从而一定程度上可以确保获取效率。进一步地,对非历史搜索词的预设标准词提前进行展示,以为该预设标准词累计搜索次数,从而确保后续针对构造的预设标准词中的非历史搜索词也能准确的衡量这些预设标准词的被需求程度。
下面对本发明涉及的一种应用场景进行说明。互联网发展导致了信息爆炸的问题,而搜索服务的出现方便了用户的信息获取。搜索建议是基于搜索服务的基础上,在用户输入搜索触发词的时进行搜索词建议的工具。以网络平台为生活服务平台的应用场景进行说明。生活服务平台可以包含三个主要成分:平台,商户,用户。平台把商户或者商户中的商品展现给用户,因此用户的搜索最终的落脚点在商户或者商品。商户作为主要供给方,用户作为主要需求方,平台的作用是做到供需平衡。生活服务平台是生活服务信息聚合然后服务于用户的平台,搜索建议作为用户在平台上搜索相关生活服务的时用于快速补全的方式。在一种现有方式中,往往是通过收集用户搜索日志,通过机器学习排序方法进行搜索词建议的。这种方式中,对于所有用户搜索日志中未出现过的词无法进行建议、且可能会造成搜索建议词出现无搜索结果的情况,进一步地,对于平台新提供的物品或者服务,由于用户没有认知往往会导致无法快速冷启动。
本发明实施例中,从供给角度将商户和商品(即,网络对象)分为不同的类别,例如,故宫,颐和园可以作为景点类别,火锅,烧烤可以作为美食类别。从需求角度将用户的历史搜索词进行分词以后映射到不同的类别和组合模式(即,预设类别组合)。例如,“故宫周边美食”可以分词为“故宫、周边、美食”,这种模式可以为“景点类别+美食类别”。进一步地,根据用户的搜索和商户的供给,挖掘出所有的组合模式,然后通过组合模式构造预设标准词。这样,当用户输入某个搜索词时,可以基于预设标准词即可进行相关的建议词推送。
示例的,以预设类别组合的组合模式为“A类别+B类别”,A类别对应的词语为表征地理区域的词语为例。图2是本发明实施例提供的一种生成过程示意图,如图2所示,可以根据用户搜索历史进行分词,并对每个词进行类别标注。即,进行需求标注,以确定历史搜索词中各分词对应的类别。以及,收集系统中所有的POI,并对每个POI进行类别标注。即,进行供给标注,以确定网络平台中各网络对象所属的类别以及对应关键词。
然后,统计用户搜索历史中的类别共现关系,构造出不同的“A类别+B 类别”的组合模式的构造词。即,生成预设类别组合并根据预设类别组合中各类别下的关键词进行组合,以构造预设标准词。接着,计算每个构造词的第一类别词周边的第二类别词的POI数量并进行量化供给。即,计算预设标准词对应的预设供给分值。然后,计算每个构造词的搜索历史,以及每个触发词的搜索次数并进行量化需求。即,计算预设标准词对应的预设需求分值。最后,当用户搜索请求中包含触发词时,利用量化供给和量化需求获取价值分值,以展示给用户所有相关的构造词。即,获取搜索词命中的候选建议词,并计算候选建议词对应的价值分值,按照候选建议词对应的价值分值为用户展现目标建议词。
这样,根据组合模式生成构造词,可以使得构造词覆盖用户搜索日志中未出现过的词以及命中平台新提供的物品或者服务,从而使得后续可以对用户搜索日志中未出现过的词进行建议,以及增大新提供的物品或者服务被搜索的概率,从而一定程度上解决无法快速冷启动的问题。同时,通过量化供给,一定程度上可以避免出现无搜索结果的情况。
图3是本发明实施例提供的一种搜索建议词生成装置的结构图,该装置 20可以包括:
第一获取模块201,用于获取搜索词命中的预设标准词,以作为候选建议词;所述预设标准词是根据预设类别组合构建的,所述预设标注词中各分词对应的类别属于所述预设类别组合;
第一确定模块202,用于对于任一所述候选建议词,确定所述候选建议词对应的价值分值;所述价值分值与所述候选建议词命中的网络对象的第一数量正相关;
选择模块203,用于基于所述价值分值,从所述候选建议词中为所述搜索词选择目标建议词。
可选的,所述装置20还包括:
生成模块,用于对于网络平台中的任一历史搜索词,根据所述历史搜索词中各分词对应的类别,生成候选类别组合;
第二确定模块,用于根据所述候选类别组合,确定所述预设类别组合。
可选的,所述第二确定模块,具体用于:
将所述候选类别组合直接确定为所述预设类别组合;或者,
统计所述候选类别组合中各类别对应的分词的第一出现次数,以及,所述候选类别组合的第二出现次数;将第一出现次数大于第一预设阈值且第二出现次数大于第二预设阈值的候选类别组合,确定为所述预设类别组合。
可选的,所述装置20还包括:
第三确定模块,用于根据网络平台中各网络对象所属的类别以及对应关键词,确定各类别下的关键词,得到备用关键词;
组合模块,用于对于任一所述预设类别组合,从所述备用关键词中获取所述预设类别组合中各类别下的关键词,并进行组合,得到所述预设标准词。
可选的,所述第一确定模块202,具体用于:
基于各所述预设标准词对应的预设需求分值以及预设供给分值,获取所述候选建议词对应的需求分值以及供给分值,得到目标需求分值以及目标供给分值;所述目标需求分值与所述候选建议词的被需求程度正相关,所述目标供给分值与所述第一数量正相关;
根据所述目标需求分值以及所述目标供给分值,计算所述候选建议词对应的价值分值;所述价值分值与所述目标需求分值以及所述目标供给分值正相关。
可选的,所述装置20还包括:
第四确定模块,用于对于任一所述预设标准词,确定所述第一数量以及所述预设标准词所命中地理区域内的网络对象的第二数量;
第一计算模块,用于计算所述第一数量与所述第二数量之间的第一比值,和/或,计算第一相对比值;所述第一相对比值是所述第一比值与词语比值之间的比值,所述词语比值为第一词语数量与所述预设标准词的总数量之间的比值,第一词语数量是与所述预设标准词对应的预设类别组合相匹配的预设标准词的数量;
第二计算模块,用于根据所述第一比值和/或所述第一相对比值,计算所述预设供给分值;所述预设供给分值与所述第一比值以及所述第一相对比值正相关。
可选的,所述装置20还包括:
第二获取模块,用于对于任一所述预设标准词,获取所述预设标准词的搜索次数;
第三计算模块,用于计算所述搜索次数与第一展现次数之间的第二比值;所述第一展现次数是目标预设标准词的展现次数,所述目标预设标准词与所述预设标准词命中的触发词相同;和/或,计算第二相对比值;所述第二相对比值是所述第二比值与全局搜索比值之间的比值,所述全局搜索比值为所有预设标准词的搜索总次数与展现总次数之间的比值;
第四计算模块,用于根据所述第二比值和/或所述第二相对比值,计算所述预设需求分值;所述预设需求分值与所述第二比值以及所述第二相对比值正相关。
可选的,在所述预设标准词为历史搜索词的情况下,所述第二获取模块,具体用于:将所述历史搜索词的历史搜索次数确定为所述搜索次数;
在所述预设标准词不为历史搜索词的情况下,所述第二获取模块,具体用于:在预设展示期内,在网络平台中对所述预设标准词进行展示;获取所述预设标准词在所述预设展示期内的搜索次数。
本发明实施例提供的搜索建议词生成装置,通过获取搜索词命中的预设标准词,以作为候选建议词,预设标准词是根据预设类别组合构建的,预设标注词中各分词对应的类别属于预设类别组合。对于任一候选建议词,确定候选建议词对应的价值分值。价值分值与候选建议词命中的网络对象的第一数量正相关。基于价值分值,从候选建议词中为搜索词选择目标建议词。相较于直接选择历史搜索词的方式,本发明实施例中,基于与第一数量正相关的价值分值选择目标建议词,一定程度上可以确保最终以选择的目标建议词搜索时,能够为用户提供较为充足的供给,进而确保建议词的搜索效果。同时,根据预设类别组合构建的预设标准词的覆盖面往往大于历史搜索词的覆盖面。因此,本发明实施例中基于预设标准词选择目标建议词的方式,一定程度上可以使得未被搜索过的词语也有机会被推荐给用户,进而提高建议词的推荐范围以及增大建议词所命中的网络对象的范围。
本发明还提供了一种电子设备,参见图4,包括:处理器301、存储器 302以及存储在所述存储器上并可在所述处理器上运行的计算机程序3021,所述处理器执行所述程序时实现前述实施例的搜索建议词生成方法。
本发明还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的搜索建议词生成方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明的排序设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种搜索建议词生成方法,其特征在于,所述方法包括:
获取搜索词命中的预设标准词,以作为候选建议词;所述预设标准词是通过对预设类别组合中各类别下的关键词进行组合得到的,所述预设标准词中各分词对应的类别属于所述预设类别组合;所述预设标准词通过下述方式得到:根据网络平台中各网络对象所属的类别以及对应关键词,确定各类别下的关键词,得到备用关键词;对于任一所述预设类别组合,从所述备用关键词中获取所述预设类别组合中各类别下的关键词,并进行组合,得到所述预设标准词;
对于任一所述候选建议词,确定所述候选建议词对应的价值分值;所述价值分值与所述候选建议词命中的网络对象的第一数量正相关;
基于所述价值分值,从所述候选建议词中为所述搜索词选择目标建议词。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对于网络平台中的任一历史搜索词,对所述历史搜索词中各分词对应的类别进行组合,得到候选类别组合;
根据所述候选类别组合,确定所述预设类别组合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述候选类别组合,确定所述预设类别组合,包括:
将所述候选类别组合直接确定为所述预设类别组合;或者,
统计所述候选类别组合中各类别对应的分词的第一出现次数,以及,所述候选类别组合的第二出现次数;将第一出现次数大于第一预设阈值且第二出现次数大于第二预设阈值的候选类别组合,确定为所述预设类别组合。
4.根据权利要求1所述的方法,其特征在于,所述确定所述候选建议词对应的价值分值,包括:
基于各所述预设标准词对应的预设需求分值以及预设供给分值,获取所述候选建议词对应的需求分值以及供给分值,得到目标需求分值以及目标供给分值;所述目标需求分值与所述候选建议词的被需求程度正相关,所述目标供给分值与所述第一数量正相关;
根据所述目标需求分值以及所述目标供给分值,计算所述候选建议词对应的价值分值;所述价值分值与所述目标需求分值以及所述目标供给分值正相关。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对于任一所述预设标准词,确定所述第一数量以及所述预设标准词所命中地理区域内的网络对象的第二数量;
计算所述第一数量与所述第二数量之间的第一比值,和/或,计算第一相对比值;所述第一相对比值是所述第一比值与词语比值之间的比值,所述词语比值为第一词语数量与所述预设标准词的总数量之间的比值,第一词语数量是与所述预设标准词对应的预设类别组合相匹配的预设标准词的数量;
根据所述第一比值和/或所述第一相对比值,计算所述预设供给分值;所述预设供给分值与所述第一比值以及所述第一相对比值正相关。
6.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:
对于任一所述预设标准词,获取所述预设标准词的搜索次数;
计算所述搜索次数与第一展现次数之间的第二比值;所述第一展现次数是目标预设标准词的展现次数,所述目标预设标准词与所述预设标准词命中的触发词相同;和/或,计算第二相对比值;所述第二相对比值是所述第二比值与全局搜索比值之间的比值,所述全局搜索比值为所有预设标准词的搜索总次数与展现总次数之间的比值;
根据所述第二比值和/或所述第二相对比值,计算所述预设需求分值;所述预设需求分值与所述第二比值以及所述第二相对比值正相关。
7.根据权利要求6所述的方法,其特征在于,在所述预设标准词为历史搜索词的情况下,所述获取所述预设标准词的搜索次数,包括:将所述历史搜索词的历史搜索次数确定为所述搜索次数;
在所述预设标准词不为历史搜索词的情况下,所述获取所述预设标准词的搜索次数,包括:在预设展示期内,在网络平台中对所述预设标准词进行展示;获取所述预设标准词在所述预设展示期内的搜索次数。
8.一种搜索建议词生成装置,其特征在于,所述装置包括:
第一获取模块,用于获取搜索词命中的预设标准词,以作为候选建议词;所述预设标准词是通过对预设类别组合中各类别下的关键词进行组合得到的,所述预设标准词中各分词对应的类别属于所述预设类别组合;所述预设标准词通过下述方式得到:根据网络平台中各网络对象所属的类别以及对应关键词,确定各类别下的关键词,得到备用关键词;对于任一所述预设类别组合,从所述备用关键词中获取所述预设类别组合中各类别下的关键词,并进行组合,得到所述预设标准词;
第一确定模块,用于对于任一所述候选建议词,确定所述候选建议词对应的价值分值;所述价值分值与所述候选建议词命中的网络对象的第一数量正相关;
选择模块,用于基于所述价值分值,从所述候选建议词中为所述搜索词选择目标建议词。
9.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中一个或多个所述的搜索建议词生成方法。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1-7中一个或多个所述的搜索建议词生成方法。
CN202110663574.7A 2021-06-15 2021-06-15 搜索建议词生成方法、装置、电子设备及可读存储介质 Active CN113505281B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110663574.7A CN113505281B (zh) 2021-06-15 2021-06-15 搜索建议词生成方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110663574.7A CN113505281B (zh) 2021-06-15 2021-06-15 搜索建议词生成方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113505281A CN113505281A (zh) 2021-10-15
CN113505281B true CN113505281B (zh) 2022-11-08

Family

ID=78010152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110663574.7A Active CN113505281B (zh) 2021-06-15 2021-06-15 搜索建议词生成方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113505281B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1684072A (zh) * 2004-04-15 2005-10-19 微软公司 对多意义查询的相关术语提议
US8700621B1 (en) * 2012-03-20 2014-04-15 Google Inc. Generating query suggestions from user generated content
CN106484889A (zh) * 2016-10-18 2017-03-08 合信息技术(北京)有限公司 网络资源的泛搜索方法和装置
CN107273537A (zh) * 2017-06-30 2017-10-20 深圳创维数字技术有限公司 一种搜索词推荐方法、机顶盒和存储介质
CN107688606A (zh) * 2017-07-26 2018-02-13 北京三快在线科技有限公司 一种推荐信息的获取方法及装置,电子设备
US10185748B1 (en) * 2013-08-22 2019-01-22 Evernote Corporation Combining natural language and keyword search queries for personal content collections
CN109918555A (zh) * 2019-02-20 2019-06-21 百度在线网络技术(北京)有限公司 用于提供搜索建议的方法、装置、设备和介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9171088B2 (en) * 2011-04-06 2015-10-27 Google Inc. Mining for product classification structures for internet-based product searching
CN103729359B (zh) * 2012-10-12 2017-03-01 阿里巴巴集团控股有限公司 一种推荐搜索词的方法及系统
US20140188861A1 (en) * 2012-12-28 2014-07-03 Google Inc. Using scientific papers in web search
US9836554B2 (en) * 2014-04-30 2017-12-05 Excalibur Ip, Llc Method and system for providing query suggestions including entities
CN105138690B (zh) * 2015-09-18 2018-11-06 北京博雅立方科技有限公司 确定关键词的方法和装置
RU2692045C1 (ru) * 2018-05-18 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для рекомендации свежих саджестов поисковых запросов в поисковой системе
CN110598108A (zh) * 2019-09-12 2019-12-20 珠海随变科技有限公司 一种搜索词推荐方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1684072A (zh) * 2004-04-15 2005-10-19 微软公司 对多意义查询的相关术语提议
US8700621B1 (en) * 2012-03-20 2014-04-15 Google Inc. Generating query suggestions from user generated content
US10185748B1 (en) * 2013-08-22 2019-01-22 Evernote Corporation Combining natural language and keyword search queries for personal content collections
CN106484889A (zh) * 2016-10-18 2017-03-08 合信息技术(北京)有限公司 网络资源的泛搜索方法和装置
CN107273537A (zh) * 2017-06-30 2017-10-20 深圳创维数字技术有限公司 一种搜索词推荐方法、机顶盒和存储介质
CN107688606A (zh) * 2017-07-26 2018-02-13 北京三快在线科技有限公司 一种推荐信息的获取方法及装置,电子设备
CN109918555A (zh) * 2019-02-20 2019-06-21 百度在线网络技术(北京)有限公司 用于提供搜索建议的方法、装置、设备和介质

Also Published As

Publication number Publication date
CN113505281A (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
EP3623956A1 (en) Method and apparatus for obtaining recommendation information, and electronic device
CN102982153B (zh) 一种信息检索方法及其装置
CN110532351B (zh) 推荐词展示方法、装置、设备及计算机可读存储介质
CN113570413B (zh) 广告关键词的生成方法、装置、存储介质及电子设备
CN106445963B (zh) App平台的广告索引关键词自动生成方法和装置
US20150088862A1 (en) Information processing system, similar category identification method, program, and computer readable information storage medium
CN105718184A (zh) 一种数据处理方法和装置
CN108319376B (zh) 一种优化商业词推广的输入联想推荐方法及装置
RU2010125682A (ru) Способы и устройство обеспечения системы прогнозирования групповой торговли
CN111080339B (zh) 基于场景的类目偏好数据生成方法及装置
CN104182517A (zh) 数据处理的方法及装置
CN108429776B (zh) 网络对象的推送方法、装置、客户端、交互设备以及系统
CN110750697B (zh) 商户分类方法、装置、设备及存储介质
CN113505301A (zh) 一种信息查询方法及其相关设备
CN111523043B (zh) 资源信息展示、管理方法及装置
CN110647679A (zh) 一种o2o场景下的搜索结果综合排序方法
JP2008084193A (ja) インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム
CN111144936B (zh) 基于用户标签的相似人群扩展方法及装置
CN114969566A (zh) 一种距离度量的政务服务事项协同过滤推荐方法
CN105740434A (zh) 网络信息评分方法及装置
CN113505281B (zh) 搜索建议词生成方法、装置、电子设备及可读存储介质
CN112287976A (zh) 一种对象推荐方法、装置、电子设备及存储介质
JP2012133694A (ja) 需要予測方法
CN110020209A (zh) 内容和搜索词的相关性确定方法及系统、展示方法及系统
CN113918796A (zh) 信息搜索方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant