CN106909688B - 一种基于输入搜索词来推荐搜索词的方法和装置 - Google Patents

一种基于输入搜索词来推荐搜索词的方法和装置 Download PDF

Info

Publication number
CN106909688B
CN106909688B CN201710130848.XA CN201710130848A CN106909688B CN 106909688 B CN106909688 B CN 106909688B CN 201710130848 A CN201710130848 A CN 201710130848A CN 106909688 B CN106909688 B CN 106909688B
Authority
CN
China
Prior art keywords
search
application
search word
input
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710130848.XA
Other languages
English (en)
Other versions
CN106909688A (zh
Inventor
潘岸腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201710130848.XA priority Critical patent/CN106909688B/zh
Publication of CN106909688A publication Critical patent/CN106909688A/zh
Priority to PCT/CN2017/120266 priority patent/WO2018161710A1/zh
Application granted granted Critical
Publication of CN106909688B publication Critical patent/CN106909688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于输入搜索词来推荐搜索词的方法和装置。所述方法包括:确定用户输入的搜索词与预置应用库里的应用的匹配度;将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合;确定预置应用库里的两两应用之间的第一相似度;基于所述匹配度、所述输入的搜索词的标签集合和所述第一相似度来确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度;基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。

Description

一种基于输入搜索词来推荐搜索词的方法和装置
技术领域
本发明涉及信息处理技术领域,具体而言涉及一种基于输入搜索词来推荐搜索词的方法和装置。
背景技术
随着互联网技术和智能移动终端技术的快速发展,很多在计算机终端上实现的功能(例如购物、阅读)也都可以在智能移动终端上实现,例如使用智能手机或平板电脑等。另外,这些功能的实现需要在智能移动终端上安装相应的应用程序。例如,网上购物,需要安装例如淘宝客户端,听音乐需要安装音乐播放器客户端等。由此,很多软件公司提供了应用商店或应用市场,例如豌豆荚或者PP助手等。用户可以打开应用商店或者应用市场,从而能够快速搜索和下载所需要的各种应用程序,包括影音播放类、系统工具类、通讯社交类、网上购物类、阅读类等,当然还可以下载游戏等休闲娱乐类应用程序(APP)。
在应用商店或应用市场中搜索页面是用户下载应用的最重要入口,为了帮助用户发现更多有趣的应用,在搜索页面还增加有二次搜索引导的推荐功能,例如“大家还在搜”推荐功能或类型推荐功能,如图1所示,该推荐功能是根据用户当前输入的搜索词提供其他相关联的搜索词作为展示推荐。
在实践中,根据现有的搜索词推荐方法提供的作为二次搜索引导的搜索词,在符合用户的兴趣方面还存在一些不足,使得用户使用推荐的搜索词进行二次搜索的意向不高。因此需要不断开发新的搜索词推荐方法以帮助用户通过推荐的搜索词发现更多有趣的应用,从而提高用户的使用体验感。
发明内容
本发明的目的在于一种基于输入搜索词来推荐搜索词的方法和装置,以改善上述的问题。
本发明实施例提供了一种基于输入搜索词来推荐搜索词的方法,包括:
确定用户输入的搜索词与预置应用库里的应用的匹配度;
将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合;
确定预置应用库里的两两应用之间的第一相似度;
基于所述匹配度、所述输入的搜索词的标签集合和所述第一相似度来确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度;
基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。
优选的,在确定用户输入的搜索词与预置应用库里的应用的匹配度的步骤中,所述匹配度为通过所述输入的搜索词下载一个应用的用户数量与通过所述输入的搜索词下载多个不同应用的用户数量总和之比,其计算方法如下:
Figure BDA0001239934010000021
其中:Pl,i表示用户输入的搜索词l与预置应用库里的应用i的匹配度;
Dl,i表示通过搜索词l下载了应用i的用户数量;
Figure BDA0001239934010000022
表示通过搜索词l下载了多个不同应用j的用户数量总和;
n表示应用库里的应用数量。
优选的,在确定预置应用库里的两两应用之间的第一相似度的步骤中,使用计算杰卡德相似系数的方法来确定:
Figure BDA0001239934010000031
其中:Simi,j表示应用库里的应用i和应用j之间的第一相似度;
n表示应用库里的应用数量;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合。
优选的,在基于所述匹配度、所述输入的搜索词的标签集合和所述第一相似度来确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度的步骤中,使用下述方法来确定所述第二相似度:
Figure BDA0001239934010000032
i=1,2,…,n;j=1,2,…,n;k=1,2,…,m
其中:Wl,k表示用户输入的搜索词l与预置搜索词集合里搜索词k之间的第二相似度;
n表示应用库里的应用数量;
m表示表示预置搜索词集合里的搜索词数量;
Kl表示用户输入的搜索词l的标签集合;
Kk表示预置搜索词集合里搜索词k的标签集合;
Pl,i表示用户输入的搜索词l与应用库里的应用i的匹配度;
Pk,j表示预置搜索词集合里搜索词k与应用库里的应用j的匹配度;
Simi,j表示应用库里的应用i和应用j之间的第一相似度。
优选的,所述预置搜索词集合里搜索词k与应用j的匹配度Pk,j的计算方法与用户输入的搜索词l与应用i的匹配度Pl,i的计算方法相同,即获得通过搜索词k下载一个应用的用户数量与通过该搜索词k下载多个不同应用的用户数量总和的比值;预置搜索词集合里搜索词k的标签集合Kk与用户输入的搜索词l的标签集合Kl的确定方法相同,都是使用将匹配度最高的应用具有的标签集合作为所述搜索词的标签集合的方法来确定。
优选的,按第二相似度值从大到小的顺序从预置搜索词集合中选取一定数量的搜索词向用户推荐;或者,从大于或等于预设阈值的第二相似度所对应的预置搜索词集合中的多个搜索词中随机选取一定数量的搜索词向用户推荐。
本发明实施例还提供了一种基于输入搜索词来推荐搜索词的装置,包括:
匹配度确定单元,用于确定用户输入的搜索词与应用的匹配度;
搜索词的标签集合确定单元,用于将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合;
第一相似度确定单元,用于确定预置应用库里的两两应用之间的第一相似度;
第二相似度确定单元,用于基于所述匹配度、所述输入的搜索词的标签集合和所述第一相似度来确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度;
推荐单元,用于基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。
优选的,所述匹配度确定单元用于计算通过所述输入的搜索词下载一个应用的用户数量与通过所述输入的搜索词下载多个不同应用的用户数量总和的比值来作为所述匹配度,其计算方法如下:
Figure BDA0001239934010000041
其中:Pl,i表示用户输入的搜索词l与应用i的匹配度;
Dl,i表示通过搜索词l下载了应用i的用户数量;
Figure BDA0001239934010000042
表示通过搜索词l下载了多个不同应用j的用户数量总和;
n表示应用库里的应用数量。
优选的,所述第一相似度确定单元用于使用计算杰卡德相似系数的方法来确定所述第一相似度:
Figure BDA0001239934010000051
其中:Simi,j表示应用库里的应用i和应用j之间的第一相似度;
n表示应用库里的应用数量;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合。
优选的,所述第二相似度确定单元用于使用下述方法来确定所述第二相似度:
Figure BDA0001239934010000052
i=1,2,…,n;j=1,2,…,n;k=1,2,…,m
其中:Wl,k表示用户输入的搜索词l与预置搜索词集合里搜索词k之间的第二相似度;
n表示应用库里的应用数量;
m表示表示预置搜索词集合里的搜索词数量;
Kl表示用户输入的搜索词l的标签集合;
Kk表示预置搜索词集合里搜索词k的标签集合;
Pl,i表示用户输入的搜索词l与应用库里的应用i的匹配度;
Pk,j表示预置搜索词集合里搜索词k与应用库里的应用j的匹配度;
Simi,j表示应用库里的应用i和应用j之间的第一相似度。
优选的,所述第二相似度确定单元在确定所述第二相似度的过程中,所述预置搜索词集合里搜索词k与应用j的匹配度Pk,j的计算方法与用户输入的搜索词l与应用i的匹配度Pl,i的计算方法相同,是将通过搜索词k下载一个应用的用户数量与通过该搜索词k下载多个不同应用的用户数量总和的比值来作为所述匹配度;预置搜索词集合里搜索词k的标签集合Kk与用户输入的搜索词l的标签集合Kl的确定方法相同,都是使用将匹配度最高的应用具有的标签集合作为所述搜索词的标签集合的方法来确定。
优选的,按第二相似度值从大到小的顺序从预置搜索词集合中选取一定数量的搜索词向用户推荐;或者,从大于或等于预设阈值的第二相似度所对应的预置搜索词集合中的多个搜索词中随机选取一定数量的搜索词向用户推荐。
根据本发明的基于输入搜索词来推荐搜索词的方法和装置,基于用户输入的搜索词l与应用库里的应用i的匹配度、应用库里的应用i和应用j之间的第一相似度、搜索词集合里的搜索词k与应用库里的应用j的匹配度、再给用户输入的搜索词l标上标签集合、分别给搜索词集合里的搜索词k标上标签集合,从中找出具有与用户输入的搜索词l所具有的标签相同的标签的搜索词k,根据建立的这些关联性,可以确定出用户输入的搜索词与预置搜索词集合中的其它搜索词之间的相似度,由此选择相似度高的多个搜索词作为推荐搜索词,从而所推荐的搜索词更符合用户的兴趣,提高了用户使用推荐的搜索词进行二次搜索的意向,提高了用户体验。
附图说明
图1是根据现有技术在应用商店的搜索页面上基于用户输入的搜索词使用“大家还在搜”推荐功能提供推荐搜索词的一个例子的截图;
图2是本发明实施例提供的基于输入搜索词来推荐搜索词的方法的流程图;
图3是本发明实施例提供的基于输入搜索词来推荐搜索词的装置的示意性框图。
具体实施方式
下面将结合本发明实施例和附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2是本发明实施例提供的基于输入搜索词来推荐搜索词的方法的流程图。如图2所示,本发明的基于输入搜索词来推荐搜索词的方法包括以下步骤:
S1:确定用户输入的搜索词与预置应用库里的应用的匹配度。
要想实现根据用户输入的搜索词来推荐可能让用户感兴趣的相关联搜索词,首先需要知道通过用户输入的搜索词都可以下载哪些应用,继而确定所输入的搜索词与那些下载的应用之间匹配度的排序。通过用户输入的搜索词都下载了哪些应用是可以通过后台服务器统计出来的。本领域技术人员都知道,可以对这种统计数据限定一个期限,例如统计1周内、2周内、1个月内、3个月内、6个月内、12个月内等通过用户输入的搜索词都下载了哪些应用、下载每种应用的用户数量等信息。另外,本领域技术人员都知道开发应用商店或应用市场的目的和作用,应用商店或应用市场里预置了应用库,该应用库里放置了由不同第三方应用程序开发商开发的大量的各种应用。这样,确定用户输入的搜索词与预置应用库里的应用的匹配度的方法就是获得通过所述输入的搜索词下载一个应用的用户数量与通过所述输入的搜索词下载多个不同应用的用户数量总和的比值,即所述匹配度为通过所述输入的搜索词下载一个应用的用户数量与通过所述输入的搜索词下载多个不同应用的用户数量总和之比,其计算方法如下:
Figure BDA0001239934010000081
其中:Pl,i表示用户输入的搜索词l与预置应用库里的应用i的匹配度;
Dl,i表示通过搜索词l下载了应用i的用户数量;
Figure BDA0001239934010000082
表示通过搜索词l下载了多个不同应用j的用户数量总和;
n表示应用库里的应用数量。
本领域技术人员都知道,统计通过搜索词l下载了应用i的用户数量时,需要限定一个时间段才能有统计结果,如上所述,可以统计1周、2周、1个月、3个月、6个月内、12个月等时间段内的用户下载行为。
例如,假设一个用户在应用商店或应用市场中搜索页面上输入了一个搜索词“斗地主”,在1周的时间内通过搜索词“斗地主”下载了应用商店或应用市场所提供的应用A的用户数量为100,通过搜索词“斗地主”下载了应用商店或应用市场所提供的应用B的用户数量为200,通过搜索词“斗地主”下载了应用商店或应用市场所提供的应用C的用户数量为300,则根据本发明提供的确定用户输入的搜索词与预置应用库里的应用的匹配度的方法可知,该用户输入的搜索词“斗地主”与应用A的匹配度为100/100+200+300=0.167,该用户输入的搜索词“斗地主”与应用B的匹配度为200/100+200+300=0.333,该用户输入的搜索词“斗地主”与应用C的匹配度为300/100+200+300=0.5。
S2:将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合。
在确定了用户输入的搜索词与预置应用库里的应用的匹配度之后,需要确定与用户输入的搜索词匹配的标签集合,这里采用将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合的方法来实现。由于应用商店或应用市场中提供的应用都具有1个或多个标签,根据上面计算确定的用户输入的搜索词与预置应用库里的应用的匹配度值,将匹配度值最大的应用所具有的标签集合作为所述输入的搜索词的标签集合。
S3:确定预置应用库里的两两应用之间的第一相似度。
在本步骤中,使用计算杰卡德相似系数的方法来确定预置应用库里的两两应用之间的第一相似度:
Figure BDA0001239934010000091
其中:Simi,j表示应用库里的应用i和应用j之间的第一相似度;
n表示应用库里的应用数量;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合。
在这里,使用同时安装有应用i和应用j的用户数量与安装了应用i的用户数量和安装了应用j的用户数量之和的比值作为第一相似度。
S4:基于所述匹配度、所述输入的搜索词的标签集合和所述第一相似度来确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度。
在经过以上步骤得到了所述匹配度、所述输入的搜索词的标签集合和所述第一相似度后,就可以确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度。
本领域技术人员都知道在应用商店或应用市场增加有二次搜索引导的推荐功能后,应用商店或应用市场都会预置一些热门的搜索词作为推荐使用。这里所述的热门搜索词可以采用在预定时间段内搜索量排在前面的搜索词,例如可以将在1周内搜索量排名在前500名、或者前1千名、或者前1万名以内的搜索词(可以根据实践需要自行设定取数量)集合在一起作为预置搜索词集合。
由此基于所述匹配度、所述输入的搜索词的标签集合和所述第一相似度,使用下述方法来确定所述第二相似度:
Figure BDA0001239934010000101
i=1,2,…,n;j=1,2,…,n;k=1,2,…,m
其中:Wl,k表示用户输入的搜索词l与预置搜索词集合里搜索词k之间的第二相似度;
n表示应用库里的应用数量;
m表示表示预置搜索词集合里的搜索词数量;
Kl表示用户输入的搜索词l的标签集合;
Kk表示预置搜索词集合里搜索词k的标签集合;
Pl,i表示用户输入的搜索词l与应用库里的应用i的匹配度;
Pk,j表示预置搜索词集合里搜索词k与应用库里的应用j的匹配度;
Simi,j表示应用库里的应用i和应用j之间的第一相似度。
另外,所述预置搜索词集合里搜索词k与应用库里的应用j的匹配度Pk,j的计算方法与用户输入的搜索词l与应用库里的应用i的匹配度Pl,i的计算方法相同,即获得通过搜索词k下载一个应用j的用户数量与通过该搜索词k下载多个不同应用的用户数量总和的比值作为匹配度Pk,j;预置搜索词集合里搜索词k的标签集合Kk与用户输入的搜索词l的标签集合Kl的确定方法相同,都是使用将匹配度最高的应用具有的标签集合作为所述搜索词的标签集合的方法来确定。
由该公式可以看出,基于用户输入的搜索词l与应用库里的应用i的匹配度、应用库里的应用i和应用j之间的第一相似度、搜索词集合里的搜索词k与应用库里的应用j的匹配度、再分别给搜索词集合里的搜索词k标上标签集合之后,从中找出具有与用户输入的搜索词l所具有的标签相同的标签的搜索词k,根据建立的这些关联性,可以确定出所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度。这样可以根据第二相似度的大小来选取一定数量的搜索词作为推荐的搜索词,如下一步骤所述。
S5:基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。
根据上一步可以计算出用户输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度,基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。优选的,可以按第二相似度值从大到小的顺序从预置搜索词集合中选取一定数量的搜索词向用户推荐,例如按第二相似度值从大到小的顺序将相对应的搜索词做降序排列,选取排名靠前的例如10个或者20个等搜索词作为推荐搜索词向用户推荐。当然,选取搜索词的数量可以自行设定,不限于这里举例的10或20。优选的,还可以预先设置一个阈值,从大于或等于预设阈值的第二相似度所对应的预置搜索词集合中的多个搜索词中随机选取一定数量的搜索词向用户推荐。当然,除了随机选取之外,也可以在大于或等于预设阈值的多个第二相似度中,按第二相似度值从大到小的顺序来选取相应的多个搜索词。在这个优选实施例中,选取搜索词的数量与上述一样,可以自行设定,选取排名靠前的或者随机选取例如10个或者20个等搜索词作为推荐搜索词,当然还可以选取更多个或其他数量的搜索词作为推荐搜索词而不局限于这里举例的10或20。
另外,尽管上面以具体实施例的方式公开了本发明的基于输入搜索词来推荐搜索词的方法,本领域技术人员都知道,在确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度的过程中,只要预先确定出用户输入的搜索词l与应用库里的应用i的匹配度、应用库里的应用i和应用j之间的第一相似度、搜索词集合里的搜索词k与应用库里的应用j的匹配度、给用户输入的搜索词l标上标签集合、给搜索词集合里的搜索词k标上标签集合即可,而与得到结果的先后顺序无关,即公开的具体实施例中的步骤S3也可以放在第一步实施,原步骤S1-S2改为第二步和第三步实施;虽然在公开的具体实施例中搜索词集合里的搜索词k与应用库里的应用j的匹配度和给搜索词集合里的搜索词k标上标签集合都是在步骤S4中完成,但实际上也可以在步骤S1中执行计算搜索词集合里的搜索词k与应用库里的应用j的匹配度,然后给搜索词集合里的搜索词k标上标签集合,这里不对其他顺序做列举说明。
根据本发明的基于输入搜索词来推荐搜索词的方法,能够从预置搜索词集合中的多个搜索词中找出与用户输入的搜索词的相似度高的多个搜索词作为推荐搜索词,从而所推荐的搜索词更符合用户的兴趣,提高了用户使用推荐的搜索词进行二次搜索的意向,提高了用户体验。
图3是本发明实施例提供的基于输入搜索词来推荐搜索词的装置的示意性框图。如图3所示,本发明的于输入搜索词来推荐搜索词的装置包括:
匹配度确定单元,用于确定用户输入的搜索词与应用的匹配度;
搜索词的标签集合确定单元,用于将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合;
第一相似度确定单元,用于确定预置应用库里的两两应用之间的第一相似度;
第二相似度确定单元,用于基于所述匹配度、所述输入的搜索词的标签集合和所述第一相似度来确定所述输入的搜索词与预置搜索词集合中的其它搜索词之间的第二相似度;
推荐单元,用于基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。
优选的,所述匹配度确定单元用于计算通过所述输入的搜索词下载一个应用的用户数量与通过所述输入的搜索词下载多个不同应用的用户数量总和的比值来作为所述匹配度,其计算方法如下:
Figure BDA0001239934010000131
其中:Pl,i表示用户输入的搜索词l与应用i的匹配度;
Dl,i表示通过搜索词l下载了应用i的用户数量;
Figure BDA0001239934010000132
表示通过搜索词l下载了多个不同应用j的用户数量总和;
n表示应用库里的应用数量。
优选的,所述第一相似度确定单元用于使用计算杰卡德相似系数的方法来确定所述第一相似度:
Figure BDA0001239934010000133
其中:Simi,j表示应用库里的应用i和应用j之间的第一相似度;
n表示应用库里的应用数量;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合。
优选的,所述第二相似度确定单元用于使用下述方法来确定所述第二相似度:
Figure BDA0001239934010000134
i=1,2,…,n;j=1,2,…,n;k=1,2,…,m
其中:Wl,k表示用户输入的搜索词l与预置搜索词集合里搜索词k之间的第二相似度;
n表示应用库里的应用数量;
m表示表示预置搜索词集合里的搜索词数量;
Kl表示用户输入的搜索词l的标签集合;
Kk表示预置搜索词集合里搜索词k的标签集合;
Pl,i表示用户输入的搜索词l与应用库里的应用i的匹配度;
Pk,j表示预置搜索词集合里搜索词k与应用库里的应用j的匹配度;
Simi,j表示应用库里的应用i和应用j之间的第一相似度。
优选的,所述第二相似度确定单元在确定所述第二相似度的过程中,所述预置搜索词集合里搜索词k与应用j的匹配度Pk,j的计算方法与用户输入的搜索词l与应用i的匹配度Pl,i的计算方法相同,是将通过搜索词k下载一个应用的用户数量与通过该搜索词k下载多个不同应用的用户数量总和的比值来作为所述匹配度;预置搜索词集合里搜索词k的标签集合Kk与用户输入的搜索词l的标签集合Kl的确定方法相同,都是使用将匹配度最高的应用具有的标签集合作为所述搜索词的标签集合的方法来确定。
优选的,推荐单元用于按第二相似度值从大到小的顺序从预置搜索词集合中选取一定数量的搜索词向用户推荐;或者,从大于或等于预设阈值的第二相似度所对应的预置搜索词集合中的多个搜索词中随机选取一定数量的搜索词向用户推荐。如对应的方法步骤描述的那样,在使用从大于或等于预设阈值的第二相似度所对应的预置搜索词集合中的多个搜索词中随机选取一定数量的搜索词向用户推荐的方法时,除了随机选取之外,也可以在大于或等于预设阈值的多个第二相似度中,按第二相似度值从大到小的顺序来选取相应的多个搜索词。选取搜索词的数量与上述方法实施例一样,可以自行设定,例如10个或者20个等搜索词,或者选取更多个或其他数量的搜索词作为推荐搜索词。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再重复描述。
根据本发明的基于输入搜索词来推荐搜索词的装置,能够从预置搜索词集合中的多个搜索词中找出与用户输入的搜索词的相似度高的多个搜索词作为推荐搜索词,从而所推荐的搜索词更符合用户的兴趣,提高了用户使用推荐的搜索词进行二次搜索的意向,提高了用户体验。
本发明实施例所提供的基于输入搜索词来推荐搜索词的方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,平板电脑,智能手机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于输入搜索词来推荐搜索词的方法,包括:
确定用户输入的搜索词与预置应用库里的应用的匹配度;
将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合;
确定预置应用库里的两两应用之间的第一相似度;
对于预置搜索词集合中与用户输入的搜索词具有相同标签的其它搜索词,基于用户输入的搜索词与应用的匹配度、应用之间的第一相似度、所述其它搜索词与应用的匹配度,确定用户输入的搜索词与所述其它搜索词之间的第二相似度;
基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。
2.根据权利要求1所述的方法,其特征在于在确定用户输入的搜索词与预置应用库里的应用的匹配度的步骤中,所述匹配度为通过所述输入的搜索词下载一个应用的用户数量与通过所述输入的搜索词下载多个不同应用的用户数量总和之比,其计算方法如下:
Figure FDA0002385695370000011
其中:Pl,i表示用户输入的搜索词l与预置应用库里的应用i的匹配度;
Dl,i表示通过搜索词l下载了应用i的用户数量;
Figure FDA0002385695370000012
表示通过搜索词l下载了多个不同应用j的用户数量总和;
n表示应用库里的应用数量。
3.根据权利要求1所述的方法,其特征在于在确定预置应用库里的两两应用之间的第一相似度的步骤中,使用计算杰卡德相似系数的方法来确定:
Figure FDA0002385695370000021
其中:Simi,j表示应用库里的应用i和应用j之间的第一相似度;
n表示应用库里的应用数量;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合。
4.根据权利要求1所述的方法,其特征在于在对于预置搜索词集合中与用户输入的搜索词具有相同标签的其它搜索词,基于用户输入的搜索词与应用的匹配度、应用之间的第一相似度、所述其它搜索词与应用的匹配度,确定用户输入的搜索词与所述其它搜索词之间的第二相似度的步骤中,使用下述方法来确定所述第二相似度:
Figure FDA0002385695370000022
其中:Wl,k表示用户输入的搜索词l与预置搜索词集合里搜索词k之间的第二相似度;
n表示应用库里的应用数量;
m表示表示预置搜索词集合里的搜索词数量;
Kl表示用户输入的搜索词l的标签集合;
Kk表示预置搜索词集合里搜索词k的标签集合;
Pl,i表示用户输入的搜索词l与应用库里的应用i的匹配度;
Pk,j表示预置搜索词集合里搜索词k与应用库里的应用j的匹配度;
Simi,j表示应用库里的应用i和应用j之间的第一相似度。
5.根据权利要求4所述的方法,其特征在于所述预置搜索词集合里搜索词k与应用j的匹配度Pk,j的计算方法与用户输入的搜索词l与应用i的匹配度Pl,i的计算方法相同,即获得通过搜索词k下载一个应用的用户数量与通过该搜索词k下载多个不同应用的用户数量总和的比值;预置搜索词集合里搜索词k的标签集合Kk与用户输入的搜索词l的标签集合Kl的确定方法相同,都是使用将匹配度最高的应用具有的标签集合作为所述搜索词的标签集合的方法来确定。
6.一种基于输入搜索词来推荐搜索词的装置,包括:
匹配度确定单元,用于确定用户输入的搜索词与应用的匹配度;
搜索词的标签集合确定单元,用于将匹配度最高的应用具有的标签集合作为所述输入的搜索词的标签集合;
第一相似度确定单元,用于确定预置应用库里的两两应用之间的第一相似度;
第二相似度确定单元,用于对预置搜索词集合中与用户输入的搜索词具有相同标签的其它搜索词,基于用户输入的搜索词与应用的匹配度、应用之间的第一相似度、所述其它搜索词与应用的匹配度,确定用户输入的搜索词与所述其它搜索词之间的第二相似度;
推荐单元,用于基于所述第二相似度按预设方式从预置搜索词集合中选取一定数量的搜索词向用户推荐。
7.根据权利要求6所述的装置,其特征在于所述匹配度确定单元用于计算通过所述输入的搜索词下载一个应用的用户数量与通过所述输入的搜索词下载多个不同应用的用户数量总和的比值来作为所述匹配度,其计算方法如下:
Figure FDA0002385695370000031
其中:Pl,i表示用户输入的搜索词l与预置应用库里的应用i的匹配度;
Dl,i表示通过搜索词l下载了应用i的用户数量;
Figure FDA0002385695370000032
表示通过搜索词l下载了多个不同应用j的用户数量总和;
n表示应用库里的应用数量。
8.根据权利要求6所述的装置,其特征在于所述第一相似度确定单元用于使用计算杰卡德相似系数的方法来确定所述第一相似度:
Figure FDA0002385695370000041
其中:Simi,j表示应用库里的应用i和应用j之间的第一相似度;
n表示应用库里的应用数量;
Ui表示安装了应用i的用户集合;
Uj表示安装了应用j的用户集合。
9.根据权利要求6所述的装置,其特征在于所述第二相似度确定单元用于使用下述方法来确定所述第二相似度:
Figure FDA0002385695370000042
其中:Wl,k表示用户输入的搜索词l与预置搜索词集合里搜索词k之间的第二相似度;
n表示应用库里的应用数量;
m表示表示预置搜索词集合里的搜索词数量;
Kl表示用户输入的搜索词l的标签集合;
Kk表示预置搜索词集合里搜索词k的标签集合;
Pl,i表示用户输入的搜索词l与应用库里的应用i的匹配度;
Pk,j表示预置搜索词集合里搜索词k与应用库里的应用j的匹配度;
Simi,j表示应用库里的应用i和应用j之间的第一相似度。
10.根据权利要求9所述的装置,其特征在于所述第二相似度确定单元在确定所述第二相似度的过程中,所述预置搜索词集合里搜索词k与应用j的匹配度Pk,j的计算方法与用户输入的搜索词l与应用i的匹配度Pl,i的计算方法相同,是将通过搜索词k下载一个应用的用户数量与通过该搜索词k下载多个不同应用的用户数量总和的比值来作为所述匹配度;预置搜索词集合里搜索词k的标签集合Kk与用户输入的搜索词l的标签集合Kl的确定方法相同,都是使用将匹配度最高的应用具有的标签集合作为所述搜索词的标签集合的方法来确定。
CN201710130848.XA 2017-03-07 2017-03-07 一种基于输入搜索词来推荐搜索词的方法和装置 Active CN106909688B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710130848.XA CN106909688B (zh) 2017-03-07 2017-03-07 一种基于输入搜索词来推荐搜索词的方法和装置
PCT/CN2017/120266 WO2018161710A1 (zh) 2017-03-07 2017-12-29 一种基于输入搜索词来推荐搜索词的方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710130848.XA CN106909688B (zh) 2017-03-07 2017-03-07 一种基于输入搜索词来推荐搜索词的方法和装置

Publications (2)

Publication Number Publication Date
CN106909688A CN106909688A (zh) 2017-06-30
CN106909688B true CN106909688B (zh) 2020-10-16

Family

ID=59186183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710130848.XA Active CN106909688B (zh) 2017-03-07 2017-03-07 一种基于输入搜索词来推荐搜索词的方法和装置

Country Status (2)

Country Link
CN (1) CN106909688B (zh)
WO (1) WO2018161710A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909688B (zh) * 2017-03-07 2020-10-16 阿里巴巴(中国)有限公司 一种基于输入搜索词来推荐搜索词的方法和装置
WO2019041193A1 (zh) * 2017-08-30 2019-03-07 深圳市云中飞网络科技有限公司 应用资源处理方法及相关产品
CN108446378B (zh) * 2018-03-16 2022-04-12 蜜芽宝贝(北京)网络科技有限公司 基于用户搜索的方法、系统及计算机存储介质
CN110609956B (zh) * 2019-09-18 2022-10-11 苏州达家迎信息技术有限公司 一种信息搜索方法、装置、介质及设备
CN111967518B (zh) * 2020-08-18 2023-10-13 深圳市欢太科技有限公司 应用标注方法、应用标注装置及终端设备
CN113505230B (zh) * 2021-09-10 2021-12-21 明品云(北京)数据科技有限公司 一种承揽服务推荐方法及系统
CN113961693A (zh) * 2021-09-15 2022-01-21 北京三快在线科技有限公司 搜索结果推荐方法及装置、电子设备及可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101840420A (zh) * 2010-04-02 2010-09-22 清华大学 搜索辅助系统、搜索辅助方法及程序
CN102799594A (zh) * 2011-05-27 2012-11-28 腾讯科技(深圳)有限公司 一种信息推送方法及装置
KR20130059738A (ko) * 2011-11-29 2013-06-07 에스케이플래닛 주식회사 컨텐츠 분석에 따른 어플리케이션 추천 시스템 및 방법
CN103530339A (zh) * 2013-10-08 2014-01-22 北京百度网讯科技有限公司 移动应用信息推送方法和装置
CN104750760A (zh) * 2013-12-31 2015-07-01 中国移动通信集团上海有限公司 一种推荐应用软件的实现方法及装置
CN105095474A (zh) * 2015-08-11 2015-11-25 北京奇虎科技有限公司 建立搜索词与应用数据推荐关系的方法及装置
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN105938494A (zh) * 2016-04-14 2016-09-14 乐视控股(北京)有限公司 一种应用搜索方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714088A (zh) * 2012-10-09 2014-04-09 深圳市世纪光速信息技术有限公司 搜索词获取方法、服务器、搜索词推荐方法及系统
US20150088921A1 (en) * 2013-09-20 2015-03-26 Ebay Inc. Search guidance
CN106445963B (zh) * 2015-08-10 2021-11-23 北京奇虎科技有限公司 App平台的广告索引关键词自动生成方法和装置
CN106909688B (zh) * 2017-03-07 2020-10-16 阿里巴巴(中国)有限公司 一种基于输入搜索词来推荐搜索词的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101840420A (zh) * 2010-04-02 2010-09-22 清华大学 搜索辅助系统、搜索辅助方法及程序
CN102799594A (zh) * 2011-05-27 2012-11-28 腾讯科技(深圳)有限公司 一种信息推送方法及装置
KR20130059738A (ko) * 2011-11-29 2013-06-07 에스케이플래닛 주식회사 컨텐츠 분석에 따른 어플리케이션 추천 시스템 및 방법
CN103530339A (zh) * 2013-10-08 2014-01-22 北京百度网讯科技有限公司 移动应用信息推送方法和装置
CN104750760A (zh) * 2013-12-31 2015-07-01 中国移动通信集团上海有限公司 一种推荐应用软件的实现方法及装置
CN105095474A (zh) * 2015-08-11 2015-11-25 北京奇虎科技有限公司 建立搜索词与应用数据推荐关系的方法及装置
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN105938494A (zh) * 2016-04-14 2016-09-14 乐视控股(北京)有限公司 一种应用搜索方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Recommendation algorithm of the app store by using semantic relations between apps;Jognwoo Kim 等;《The Journal of Supercomputing》;20130731;第65卷(第1期);第16–26页 *
基于检索日志的检索词推荐研究;边鹏;《图书情报工作》;20120505;第56卷(第9期);第31-36、41页 *

Also Published As

Publication number Publication date
WO2018161710A1 (zh) 2018-09-13
CN106909688A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
CN106909688B (zh) 一种基于输入搜索词来推荐搜索词的方法和装置
CN103823908B (zh) 基于用户偏好的内容推荐方法和服务器
CN106651542B (zh) 一种物品推荐的方法及装置
CN106326391B (zh) 多媒体资源推荐方法及装置
CN106503025B (zh) 一种应用推荐方法和系统
WO2017181612A1 (zh) 个性化视频推荐方法及装置
CN106951571B (zh) 一种给应用标注标签的方法和装置
CN109492180A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
US20130166488A1 (en) Personalized information pushing method and device
CN110413888B (zh) 一种书籍推荐方法及装置
CN111782947A (zh) 一种搜索内容展示方法、装置、电子设备及存储介质
CN106874503B (zh) 获取推荐数据的方法和装置
CN110689402A (zh) 推荐商家的方法、装置、电子设备及可读存储介质
CN107103028A (zh) 一种信息处理方法及装置
CN112907334A (zh) 一种对象推荐方法及装置
CN106844724B (zh) 一种基于用户已安装应用来推荐应用的方法和装置
US20130211951A1 (en) Self learning gift recommendation engine
CN111753204B (zh) 一种信息推送方法、装置、电子设备及存储介质
CN112100221A (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
CN106960033B (zh) 一种给信息流标注标签的方法和装置
CN106919693B (zh) 一种提高热词曝光覆盖率的方法和装置
CN111782925B (zh) 物品推荐方法、装置、设备、系统及可读存储介质
CN107562846B (zh) 一种推荐应用的方法和装置
CN111553748B (zh) 一种基于用户场景的Android微服务推荐方法与系统
CN108109052A (zh) 物品推送方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200903

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 15 layer self unit 02

Applicant before: GUANGZHOU UC NETWORK TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant