CN104216995A - 信息处理方法及装置 - Google Patents
信息处理方法及装置 Download PDFInfo
- Publication number
- CN104216995A CN104216995A CN201410459385.8A CN201410459385A CN104216995A CN 104216995 A CN104216995 A CN 104216995A CN 201410459385 A CN201410459385 A CN 201410459385A CN 104216995 A CN104216995 A CN 104216995A
- Authority
- CN
- China
- Prior art keywords
- search
- word
- temperature value
- key word
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种信息处理方法及装置,该方法包括:获得终端发送的携带有当前关键词的关键词联想请求;确定与当前关键词相关的第一数量的备用联想词;依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词;向终端反馈依据正式联想词确定出当前关键词的联想信息,以使得终端输出当前关键词的联想信息。通过本方案可提高与关键词相关的联想信息的有效性。
Description
技术领域
本发明涉及信息处理领域,特别涉及一种信息处理方法及装置。
背景技术
随着科学技术飞速的发展,各种终端不断的丰富并方便了大众生活。由于利用终端处理信息具有方便快捷、节省资源等优势,使得终端成为用户的生活或工作中不可或缺的一部分。实际应用中,智能手机、笔记本电脑、平板电脑和台式电脑等终端已广泛应用于人们的日常生活中。并且,终端内可以安装各种客户端软件,例如:即时通讯客户端、网购客户端、应用市场客户端等。
其中,通过在应用市场客户端中搜索关键字来进行APP搜索的方式已经成为用户安装APP的重要途径。而如果在用户输入完成之前,就能够自动推荐当前所输入关键词的联想词,甚至直接推荐用户想要安装APP,将可以有效的减少用户从搜索APP到安装APP的时间。
现有技术中,应用市场客户端所对应的服务器基于文本相似度确定用户所输入关键词的联想词。而该种方式是静态的文本相似度匹配的方式,其只是单纯的起到了帮助用户补全自己想要输入的搜索关键词而已,并未体现用户的实际使用需求,最终导致了所确定出的与关键词相关的联想信息的有效性较低。
发明内容
基于上述问题,本发明实施例公开了一种信息处理方法及装置,以提高所确定出的与关键词相关的联想信息的有效性。技术方案如下:
第一方面,本发明实施例提供了一种信息处理方法,应用于服务器;所述方法包括:
获得终端发送的携带有当前关键词的关键词联想请求,其中,所述关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且所述当前关键词为所述文本搜索框内的当前内容;
确定与所述当前关键词相关的第一数量的备用联想词,其中,所述第一数量的备用联想词为将与所述当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词;
依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
依据各个备用联想词的搜索热度值和与所述当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;
将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词,其中,第二数量小于第一数量;
向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,以使得所述终端输出所述当前关键词的联想信息。
可选的,所述向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,包括:
将所确定出的正式联想词作为所述当前关键词的联想信息反馈给所述终端。
可选的,所述向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,包括:
依据预设的基于用户日志所确定出的搜索关键词所对应的各个APP标识的安装热度值,确定所述正式联想词中终极关联度最高的正式联想词作为搜索关键词时所对应的具有最高的安装热度值的目标APP标识;
将所述目标APP标识作为所述当前关键词的联想信息中的第一位联想信息;
将所述第一位联想信息相对应的正式联想词以外的正式联想词作为所述当前关键词的联想信息中的其余位联想信息;
向所述终端反馈所确定出的联想信息。
可选的,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,所述搜索关键词与搜索热度值的对应关系的确定方式,包括:
确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV)。
可选的,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,所述搜索关键词与搜索热度值的对应关系的确定方式,包括:
确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV);
相应的,所述搜索关键词所对应的各个APP标识的安装热度值的确定方式,包括:
基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所关联各个APP标识对应的IPA(安装APP的次数)和IUA(安装APP的用户个数);
依据第二预设公式,确定所述各个搜索关键词所关联各个APP标识所对应的安装热度值;
其中,所述第二预设公式为:
APP标识对应的安装热度值=log(IPA/IUA)。
可选的,所述依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度,包括:
利用第三预设公式,对所述各个备用联想词的搜索热度值进行归一化处理,获得各个备用联想词的归一化搜索度热度值;
依据第四预设公式,确定所述各个备用联想词与所述当前关键词的终极关联度;
其中,所述第三预设公式为:
备用联想词的归一化搜索热度值=备用联想词的搜索热度值/(各个备用联想词作为搜索关键词时所对应各个搜索热度值中最大的搜索热度值);
所述第四预设公式为:
备用联想词与所述当前关键词的终极关联度=0.4*(备用联想词与当前关键词的文本相似度)+0.6*(备用联想词的归一化搜索热度值)。
可选的,所述文本搜索框内的内容更改,包括:
文本搜索框内的内容增加、减少或变更。
可选的,所述用户日志为各个终端定期上传到所述服务器的。
第二方面,本发明实施例还提供了一种信息处理装置,应用于服务器;所述装置包括:
联想请求获得模块,用于获得终端发送的携带有当前关键词的关键词联想请求,其中,所述关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且所述当前关键词为所述文本搜索框内的当前内容;
备用联想词确定模块,用于确定与所述当前关键词相关的第一数量的备用联想词,其中,所述第一数量的备用联想词为将与所述当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词;
搜索热度值确定模块,用于依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
终极关联度确定模块,用于依据各个备用联想词的搜索热度值和与所述当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;
正式关联词确定模块,用于将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词,其中,第二数量小于第一数量;
联想信息发送模块,用于向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,以使得所述终端输出所述当前关键词的联想信息。
可选的,所述联想信息发送模块,包括:
第一联想信息发送单元,用于将所确定出的正式联想词作为所述当前关键词的联想信息反馈给所述终端,以使得所述终端输出所述当前关键词的联想信息。
可选的,所述联想信息发送模块,包括:
目标APP标识确定单元,用于依据预设的基于用户日志所确定出的搜索关键词所对应的各个APP标识的安装热度值,确定所述正式联想词中终极关联度最高的正式联想词作为搜索关键词时所对应的具有最高的安装热度值的目标APP标识;
第一位联想信息确定单元,用于将所述目标APP标识作为所述当前关键词的联想信息中的第一位联想信息;
其余位联想信息确定单元,用于将所述第一位联想信息相对应的正式联想词以外的正式联想词作为所述当前关键词的联想信息中的其余位联想信息;
第二联想信息发送单元,用于向所述终端反馈所确定出的联想信息。
可选的,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,通过对应关系确定模块确定所述搜索关键词与搜索热度值的对应关系,其中,所述对应关系确定模块,包括:
搜索关键词确定单元,用于确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
搜索信息确定单元,用于基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
第一安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
对应关系确定单元,用于利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV)。
可选的,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,通过对应关系确定模块确定搜索关键词与搜索热度值的对应关系,其中,所述对应关系确定模块,包括:
搜索关键词确定单元,用于确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
搜索信息确定单元,用于基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
第一安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
对应关系确定单元,用于利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV);
相应的,通过安装热度值确定模块确定搜索关键词所对应的各个APP标识的安装热度值,其中,所述安装热度值确定模块,包括:
第二安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所关联各个APP标识对应的IPA(安装APP的次数)和IUA(安装APP的用户个数);
安装热度值确定单元,用于依据第二预设公式,确定所述各个搜索关键词所关联各个APP标识所对应的安装热度值;
其中,所述第二预设公式为:
APP标识对应的安装热度值=log(IPA/IUA)。
可选的,所述终极关联度确定模块,包括:
归一化搜索热度值确定单元,用于利用第三预设公式,对所述各个备用联想词的搜索热度值进行归一化处理,获得各个备用联想词的归一化搜索度热度值;
终极关联度确定单元,用于依据第四预设公式,确定所述各个备用联想词与所述当前关键词的终极关联度;
其中,所述第三预设公式为:
备用联想词的归一化搜索热度值=备用联想词的搜索热度值/(各个备用联想词作为搜索关键词时所对应各个搜索热度值中最大的搜索热度值);
所述第四预设公式为:
备用联想词与所述当前关键词的终极关联度=0.4*(备用联想词与当前关键词的文本相似度)+0.6*(备用联想词的归一化搜索热度值)。
可选的,所述文本搜索框内的内容更改,包括:
文本搜索框内的内容增加、减少或变更。
可选的,所述用户日志为各个终端定期上传到所述服务器的。
本发明实施例中,服务器获得终端发送的携带有当前关键词的关键词联想请求后,将与当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词确定为与当前关键词相关的第一数量的备用联想词;依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度;将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词;向终端反馈依据正式联想词确定出当前关键词的联想信息,以使得终端输出当前关键词的联想信息。与现有技术相比,本方案中,结合文本相似度和记录众多用户的历史行为的用户日志,从基于文本相似度得到的备用联想词中筛选得到少量的正式联想词,进而依据正式联想词确定与该当前关键词相关的联想信息,使得所确定出的联想信息并非关键词的简单补充,而是较为符合用户的实际使用需求,因此,能够提高所确定出的与关键词相关的联想信息的有效性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种信息处理方法的第一种流程图;
图2为本发明实施例所提供的一种信息处理方法的第二种流程图;
图3为本发明实施例所提供的一种信息处理方法的第三种流程图;
图4为本发明实施例所提供的一种信息处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种信息处理方法及装置,以提高所确定出的与关键词相关的联想信息的有效性。
下面首先对本发明实施例所提供的一种信息处理方法进行介绍。
需要说明的是,本发明实施例所提供的信息处理方法应用于服务器。其中,该服务器为应用市场客户端所对应的服务器,并且,在实际应用中,该应用市场客户端可以为:手机助手、应用宝或应用市场等为用户提供APP下载的客户端软件。
如图1所示,一种信息处理方法,可以包括:
S101,获得终端发送的携带有当前关键词的关键词联想请求;
其中,该关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且当前关键词为该文本搜索框内的当前内容。具体的,该文本搜索框内的内容更改,可以包括:文本搜索框内的内容增加、减少或变更。
本领域技术人员可以理解的是,当用户在应用市场客户端的文本搜索框内进行输入操作时可以使得文本搜索框内的内容增加,用户在文本搜索框内进行修改操作时可以使得文本搜索框内的内容变更,而用户在文本搜索框内进行删除操作时可以使得文本搜索框内的内容减少;并且,对于文本搜索框内的内容的上述任意一种更改而言,应用市场客户端在检测到更改后可以向相应服务器发出关于文本搜索框内当前内容的关键词联想请求,其中,文本搜索框内的当前内容为当前关键词。
需要说明的是,应用市场客户端检测文本搜索框内的内容是否发生更改以及在检测到内容更改后构建关键词联想请求的具体实现方式可以采用现有技术。
S102,确定与当前关键词相关的第一数量的备用联想词;
其中,该第一数量的备用联想词为将与该当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词。实际应用中,该第一数量可以为50或100,当然并不局限与此。
需要强调的是,所谓文本相似度为一个0-1之间的浮点数数值,用于表示两个文本之间的相似程度,数值越大,表明相似程度越高;两个文本之间的文本相似度可以通过现有技术实现,也即:确定与该当前关键词具有文本相似度的联想词的具体实现过程可以采用现有技术。
S103,依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
其中,在当前关键词输入无误的情况下,由于用户最终输入的搜索关键词必然包含当前关键词,也就是,最终输入的搜索关键词与当前关键词必然存在相似度,但是,与当前关键词具有文本相似度的信息未必符合用户的实际使用需求,因此,可以通过一定的方式,从所确定出的第一数量的备用联想词中筛选得到符合用户的实际使用需求的少量的备用联想词,进而将筛选得到的少量的备用联想词确定为正式联想词。
基于上述思路,可以预先基于用户日志确定出搜索关键词与搜索热度值的对应关系,依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值,进而执行后续的依据各个备用联想词的搜索热度值和与该当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度,最终依据终极关联度,筛选得到少量的能够作为正式联想词的备用联想词。
其中,用户日志包括关于应用市场客户端的用户搜索日志和关于应用市场客户端的用户安装日志;并且,用户日志可以为各个终端定期上传到服务器的,具体的,应用市场客户端可以实时记录关于用户搜索历史的用户搜索日志和关于用户安装历史的用户安装日志,并在达到预定时间时自动上传用户日志到服务器或者在接收到服务器请求后上传用户日志给服务器。
进一步的,所述搜索关键词与搜索热度值的对应关系的确定方式,可以包括:
确定关于该应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
基于该应用市场客户端的用户搜索日志,确定各个搜索关键词所对应的第一PV(Page View,搜索页面展现次数)和第一UV(User View,执行搜索的用户个数);
基于应用市场客户端的用户安装日志,确定各个搜索关键词所对应的第二PV(Page View,搜索页面展现次数)和第二UV(User View,执行搜索的用户个数);
利用第一预设公式确定各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式可以为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV)。
需要说明的是,某一搜索关键词的第一PV可以为用户搜索日志中关于该搜索关键词的搜索日志的条数;某一搜索关键词的第二PV可以为用户安装日志中关于该搜索关键词的安装日志的条数;某一搜索关键词的第一UV可以为用户搜索日志中执行关于该搜索关键词的搜索的用户个数;某一搜索关键词的第二UV可以为用户安装日志中执行关于该搜索关键词的搜索的用户个数。
S104,依据各个备用联想词的搜索热度值和与该当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;
为了从备用联想词中筛选得到符合用户实际使用需求的少量的备用联想词,可以在确定出各个备用联想词的搜索热度值和与该当前关键词相应的文本相似度后,确定各个备用联想词与当前关键词的终极关联度,进而依据终极关联度确定出当前关键词对应的少量的正式联想词。
由于文本形似度为0-1之间的浮点数数值,为了运算有效以及方便运算,可以将搜索热度值进行归一化处理后,然后搜索热度值和与文本形似度确定各个备用联想词与当前关键词的终极关联度。具体的,所述依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度,可以包括:
利用第三预设公式,对各个备用联想词的搜索热度值进行归一化处理,获得各个备用联想词的归一化搜索度热度值;
依据第四预设公式,确定各个备用联想词与该当前关键词的终极关联度;
其中,所述第三预设公式可以为:
备用联想词的归一化搜索热度值=备用联想词的搜索热度值/(各个备用联想词作为搜索关键词时所对应各个搜索热度值中最大的搜索热度值);
所述第四预设公式可以为:
备用联想词与当前关键词的终极关联度=0.4*(备用联想词与当前关键词的文本相似度)+0.6*(备用联想词的归一化搜索热度值)。
需要说明的是,当用户日志的内容足够丰富时,所确定出的备用联想词均能够在搜索关键词与搜索热度值的对应关系中查找到,此时,直接利用上述的归一化公式确定各个备用联想词的归一化搜索热度值;但是,如果用户日志的内容不够丰富,所确定出的备用联想词中可能某些备用联想词无法在搜索关键词与搜索热度值的对应关系中查找到,此时,备用联想词不存在搜索热度值,那么,可以设置不存在搜索热度值的备用联想词对应的归一化搜索热度值为0-1之间的数值,例如:0.4、0.5或0.6等等。
S105,将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词;
在确定出各个备用联想词与当前关键词的终极关联度后,可以按照终极关联度进行排序,并将排序后排名在前的第二数量的备用联想词确定为正式联想词,也即:从众多的备用联想词中筛选获得终极关联度较高的少量的备用联想词,并将筛选得到的少量的备用联想词确定为正式联想词。其中,第二数量小于第一数量。
例如:当第一数量为100个时,第二数量可以为10个;或者,当第一数量为50个时,第二数量可以为5个,等等。
S106,向该终端反馈依据正式联想词确定出该当前关键词的联想信息,以使得该终端输出该当前关键词的联想信息。
其中,在确定出正式联想词后,可以向该终端反馈依据正式联想词确定出该当前关键词的联想信息,以使得该终端输出该当前关键词的联想信息。需要说明的是,终端输出该当前关键词的联想信息的方式可以采用现有技术实现,在此不做赘述。
可以理解的是,该当前关键词的联想信息可以为正式联想词的部分或全部,或者,也可以为对正式联想词进行一定算法处理后确定出的信息等等,这都是合理的。为了清楚起见,依据正式联想词确定该当前关键词的联想信息的方式将在后续具体实施例中给出详细介绍。
本发明实施例中,服务器获得终端发送的携带有当前关键词的关键词联想请求后,将与当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词确定为与当前关键词相关的第一数量的备用联想词;依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度;将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词;向终端反馈依据正式联想词确定出当前关键词的联想信息,以使得终端输出当前关键词的联想信息。与现有技术相比,本方案中,结合文本相似度和记录众多用户的历史行为的用户日志,从基于文本相似度得到的备用联想词中筛选得到少量的正式联想词,进而依据正式联想词确定与该当前关键词相关的联想信息,使得所确定出的联想信息并非关键词的简单补充,而是较为符合用户的实际使用需求,因此,能够提高所确定出的与关键词相关的联想信息的有效性。
下面结合具体的应用实例,对本发明实施例所提供的信息处理方法进行介绍。
需要说明的是,本发明实施例所提供的信息处理方法应用于服务器。其中,该服务器为应用市场客户端所对应的服务器,并且,在实际应用中,该应用市场客户端可以为:手机助手、应用宝或应用市场等为用户提供APP下载的客户端软件。
如图2所示,一种信息处理方法,可以包括:
S201,获得终端发送的携带有当前关键词的关键词联想请求;
其中,该关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且当前关键词为该文本搜索框内的当前内容。具体的,该文本搜索框内的内容更改,可以包括:文本搜索框内的内容增加、减少或变更。
本领域技术人员可以理解的是,当用户在应用市场客户端的文本搜索框内进行输入操作时可以使得文本搜索框内的内容增加,用户在文本搜索框内进行修改操作时可以使得文本搜索框内的内容变更,而用户在文本搜索框内进行删除操作时可以使得文本搜索框内的内容减少;并且,对于文本搜索框内的内容的上述任意一种更改而言,应用市场客户端在检测到更改后可以向相应服务器发出关于文本搜索框内当前内容的关键词联想请求,其中,文本搜索框内的当前内容为当前关键词。
需要说明的是,应用市场客户端检测文本搜索框内的内容是否发生更改以及在检测到内容更改后构建关键词联想请求的具体实现方式可以采用现有技术。
S202,确定与当前关键词相关的第一数量的备用联想词;
其中,该第一数量的备用联想词为将与该当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词。实际应用中,该第一数量可以为50或100,当然并不局限与此。
需要强调的是,所谓文本相似度为一个0-1之间的浮点数数值,用于表示两个文本之间的相似程度,数值越大,表明相似程度越高;两个文本之间的文本相似度可以通过现有技术实现,也即:确定与该当前关键词具有文本相似度的联想词的具体实现过程可以采用现有技术。
S203,依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
其中,在当前关键词输入无误的情况下,由于用户最终输入的搜索关键词必然包含当前关键词,也就是,最终输入的搜索关键词与当前关键词必然存在相似度,但是,与当前关键词具有文本相似度的信息未必符合用户的实际使用需求,因此,可以通过一定的方式,从所确定出的第一数量的备用联想词中筛选得到符合用户的实际使用需求的少量的备用联想词,进而将筛选得到的少量的备用联想词确定为正式联想词。
基于上述思路,可以预先基于用户日志确定出搜索关键词与搜索热度值的对应关系,依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值,进而执行后续的依据各个备用联想词的搜索热度值和与该当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度,最终依据终极关联度,筛选得到少量的能够作为正式联想词的备用联想词。
其中,用户日志包括关于应用市场客户端的用户搜索日志和关于应用市场客户端的用户安装日志;并且,用户日志可以为各个终端定期上传到服务器的,具体的,应用市场客户端可以实时记录关于用户搜索历史的用户搜索日志和关于用户安装历史的用户安装日志,并在达到预定时间时自动上传用户日志到服务器或者在接收到服务器请求后上传用户日志给服务器。
进一步的,所述搜索关键词与搜索热度值的对应关系的确定方式,可以包括:
确定关于该应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
基于该应用市场客户端的用户搜索日志,确定各个搜索关键词所对应的第一PV(Page View,搜索页面展现次数)和第一UV(User View,执行搜索的用户个数);
基于应用市场客户端的用户安装日志,确定各个搜索关键词所对应的第二PV(Page View,搜索页面展现次数)和第二UV(User View,执行搜索的用户个数);
利用第一预设公式确定各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式可以为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV)。
需要说明的是,某一搜索关键词的第一PV可以为用户搜索日志中关于该搜索关键词的搜索日志的条数;某一搜索关键词的第二PV可以为用户安装日志中关于该搜索关键词的安装日志的条数;某一搜索关键词的第一UV可以为用户搜索日志中执行关于该搜索关键词的搜索的用户个数;某一搜索关键词的第二UV可以为用户安装日志中执行关于该搜索关键词的搜索的用户个数。
S204,依据各个备用联想词的搜索热度值和与该当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度;
为了从备用联想词中筛选得到符合用户实际使用需求的少量的备用联想词,可以在确定出各个备用联想词的搜索热度值和与该当前关键词相应的文本相似度后,确定各个备用联想词与当前关键词的终极关联度,进而依据终极关联度确定出当前关键词对应的少量的正式联想词。
由于文本形似度为0-1之间的浮点数数值,为了运算有效以及方便运算,可以将搜索热度值进行归一化处理后,然后搜索热度值和与文本形似度确定各个备用联想词与当前关键词的终极关联度。具体的,所述依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度,可以包括:
利用第三预设公式,对各个备用联想词的搜索热度值进行归一化处理,获得各个备用联想词的归一化搜索度热度值;
依据第四预设公式,确定各个备用联想词与该当前关键词的终极关联度;
其中,所述第三预设公式可以为:
备用联想词的归一化搜索热度值=备用联想词的搜索热度值/(各个备用联想词作为搜索关键词时所对应各个搜索热度值中最大的搜索热度值);
所述第四预设公式可以为:
备用联想词与当前关键词的终极关联度=0.4*(备用联想词与当前关键词的文本相似度)+0.6*(备用联想词的归一化搜索热度值)。
需要说明的是,当用户日志的内容足够丰富时,所确定出的备用联想词均能够在搜索关键词与搜索热度值的对应关系中查找到,此时,直接利用上述的归一化公式确定各个备用联想词的归一化搜索热度值;但是,如果用户日志的内容不够丰富,所确定出的备用联想词中可能某些备用联想词无法在搜索关键词与搜索热度值的对应关系中查找到,此时,备用联想词不存在搜索热度值,那么,可以设置不存在搜索热度值的备用联想词对应的归一化搜索热度值为0-1之间的数值,例如:0.4、0.5或0.6等等。
S205,将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词;
在确定出各个备用联想词与当前关键词的终极关联度后,可以按照终极关联度进行排序,并将排序后排名在前的第二数量的备用联想词确定为正式联想词,也即:从众多的备用联想词中筛选获得终极关联度较高的少量的备用联想词,并将筛选得到的少量的备用联想词确定为正式联想词。其中,第二数量小于第一数量。
例如:当第一数量为100个时,第二数量可以为10个;或者,当第一数量为50个时,第二数量可以为5个,等等。
S206,将所确定出的正式联想词作为当前关键词的联想信息反馈给该终端,以使得该终端输出该当前关键词的联想信息。
在确定出第二数量的正式联想词后,由于正式联想词基于文本相似度和用户日志所确定,较为符合用户的实际使用需求,因此,可以直接将所确定出的正式联想词作为当前关键词的联想信息反馈给该终端。需要说明的是,终端输出该当前关键词的联想信息的方式可以采用现有技术实现,在此不做赘述。
需要强调的是,S206为上述S106所给出内容(即向该终端反馈依据正式联想词确定出该当前关键词的联想信息,以使得该终端输出该当前关键词的联想信息)的一种具体实现方式。
与现有技术相比,本方案中,结合文本相似度和记录众多用户的历史行为的用户日志,从基于文本相似度得到的备用联想词中筛选得到少量的正式联想词,进而将正式联想词确定为该当前关键词相关的联想信息,使得所确定出的联想信息并非关键词的简单补充,而是较为符合用户的实际使用需求,因此,能够提高所确定出的与关键词相关的联想信息的有效性。
下面结合另一具体实施例,对本发明实施例所提供的一种信息处理方法进行介绍。
需要说明的是,本发明实施例所提供的信息处理方法应用于服务器。其中,该服务器为应用市场客户端所对应的服务器,并且,在实际应用中,该应用市场客户端可以为:手机助手、应用宝或应用市场等为用户提供APP下载的客户端软件。
如图3所示,一种信息处理方法,可以包括:
S301,获得终端发送的携带有当前关键词的关键词联想请求;
其中,关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且该当前关键词为文本搜索框内的当前内容;具体的,该文本搜索框内的内容更改,可以包括:文本搜索框内的内容增加、减少或变更。
S302,确定与当前关键词相关的第一数量的备用联想词;
其中,该第一数量的备用联想词为将与该当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词。
S303,依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
需要强调的是,用户日志可以包括:关于应用市场客户端的用户搜索日志和关于应用市场客户端的用户安装日志;
相应的,所述搜索关键词与搜索热度值的对应关系的确定方式,可以包括:
确定关于应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
基于应用市场客户端的用户搜索日志,确定各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
基于应用市场客户端的用户安装日志,确定各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
利用第一预设公式确定各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式可以为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV);
S304,依据各个备用联想词的搜索热度值和与该当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;
S305,将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词;
其中,第二数量小于第一数量。
本实施例中,S301-S305与上述实施例的S201-S205相似,在此不做赘述。
S306,依据预设的基于用户日志所确定出的搜索关键词所对应的各个APP标识的安装热度值,确定正式联想词中终极关联度最高的正式联想词作为搜索关键词时所对应的具有最高的安装热度值的目标APP标识;
可以理解的是,由于终端在输出正式联想词后,用户点击正式联想词之后依然需要通过搜索结果页面查找所需的APP,因此,用户希望在输入当前关键词时终端能够推荐出某些与当前关键词相关的APP标识,而在所推荐出的APP标识为用户所希望查找的APP的标识时,将大大降低搜索时间。
基于上述需求,在确定出第二数量的正式联想词后,可以依据预设的基于用户日志所确定出的搜索关键词所对应的各个APP标识的安装热度值,确定正式联想词中终极关联度最高的正式联想词作为搜索关键词时所对应的具有最高的安装热度值的目标APP标识。
其中,所述搜索关键词所对应的各个APP标识的安装热度值的确定方式,可以包括:
基于应用市场客户端的用户安装日志,确定各个搜索关键词所关联各个APP标识对应的IPA(Install Page App,安装APP的次数)和IUA(Install User App,安装APP的用户个数);
依据第二预设公式,确定各个搜索关键词所关联各个APP标识所对应的安装热度值;
其中,所述第二预设公式可以为:
APP标识对应的安装热度值=log(IPA/IUA)。
具体的,对于一个搜索关键词而言,其对应有至少一个APP标识,每一个APP标识对应自身的安装热度值。其中,某个搜索关键词下的APP标识对应的IPA为:用户安装日志中基于该搜索关键词安装具有该APP标识的APP的次数;某个搜索关键词下的APP标识对应的IUA为:基于该搜索关键词实现安装具有该APP标识的APP的用户个数。
S307,将目标APP标识作为当前关键词的联想信息中的第一位联想信息;
S308,将第一位联想信息相对应的正式联想词以外的正式联想词作为当前关键词的联想信息中的其余位联想信息;
S309,向该终端反馈所确定出的联想信息,以使得该终端输出该当前关键词的联想信息。
在确定出目标APP标识后,可以将目标APP标识作为当前关键词的联想信息中的第一位联想信息,并将第一位联想信息相对应的正式联想词以外的正式联想词作为当前关键词的联想信息中的其余位联想信息,进而向该终端反馈所确定出的联想信息,以使得该终端输出该当前关键词的联想信息。需要说明的是,终端输出该当前关键词的联想信息的方式可以采用现有技术实现,在此不做赘述。
需要强调的是,S306-S309为上述S106所给出内容(即向该终端反馈依据正式联想词确定出该当前关键词的联想信息,以使得该终端输出该当前关键词的联想信息)的一种具体实现方式。
与现有技术相比,本方案中,结合文本相似度和记录众多用户的历史行为的用户日志,从基于文本相似度得到的备用联想词中筛选得到少量的正式联想词,并依据用户日志确定出作为第一位联想信息的目标APP标识,进而将目标APP标识和目标APP标识所对应正式联想词以外的正式联想词确定为与该当前关键词相关的联想信息,进一步满足了用户的实际使用需求,提高了所确定出的与关键词相关的联想信息的有效性。
相应于上述方法实施例,本发明实施例提供了一种信息处理装置,应用于服务器,如图4所示,所述装置可以包括:
联想请求获得模块410,用于获得终端发送的携带有当前关键词的关键词联想请求,其中,所述关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且所述当前关键词为所述文本搜索框内的当前内容;
备用联想词确定模块420,用于确定与所述当前关键词相关的第一数量的备用联想词,其中,所述第一数量的备用联想词为将与所述当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词;
搜索热度值确定模块430,用于依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
终极关联度确定模块440,用于依据各个备用联想词的搜索热度值和与所述当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;
正式关联词确定模块450,用于将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词,其中,第二数量小于第一数量;
联想信息发送模块460,用于向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,以使得所述终端输出所述当前关键词的联想信息。
本发明实施例中,服务器获得终端发送的携带有当前关键词的关键词联想请求后,将与当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词确定为与当前关键词相关的第一数量的备用联想词;依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与当前关键词的终极关联度;将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词;向终端反馈依据正式联想词确定出当前关键词的联想信息,以使得终端输出当前关键词的联想信息。与现有技术相比,本方案中,结合文本相似度和记录众多用户的历史行为的用户日志,从基于文本相似度得到的备用联想词中筛选得到少量的正式联想词,进而依据正式联想词确定与该当前关键词相关的联想信息,使得所确定出的联想信息并非关键词的简单补充,而是较为符合用户的实际使用需求,因此,能够提高所确定出的与关键词相关的联想信息的有效性。
在第一种实现方式中,所述联想信息发送模块460,可以包括:
第一联想信息发送单元,用于将所确定出的正式联想词作为所述当前关键词的联想信息反馈给所述终端,以使得所述终端输出所述当前关键词的联想信息。
在第二种实现方式中,所述联想信息发送模块460,可以包括:
目标APP标识确定单元,用于依据预设的基于用户日志所确定出的搜索关键词所对应的各个APP标识的安装热度值,确定所述正式联想词中终极关联度最高的正式联想词作为搜索关键词时所对应的具有最高的安装热度值的目标APP标识;
第一位联想信息确定单元,用于将所述目标APP标识作为所述当前关键词的联想信息中的第一位联想信息;
其余位联想信息确定单元,用于将所述第一位联想信息相对应的正式联想词以外的正式联想词作为所述当前关键词的联想信息中的其余位联想信息;
第二联想信息发送单元,用于向所述终端反馈所确定出的联想信息。
基于第一种实现方式,所述用户日志可以包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,通过对应关系确定模块确定所述搜索关键词与搜索热度值的对应关系,其中,所述对应关系确定模块,可以包括:
搜索关键词确定单元,用于确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
搜索信息确定单元,用于基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
第一安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
对应关系确定单元,用于利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式可以为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV)。
基于第二种实现方式,所述用户日志可以包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,通过对应关系确定模块确定搜索关键词与搜索热度值的对应关系,其中,所述对应关系确定模块,可以包括:
搜索关键词确定单元,用于确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
搜索信息确定单元,用于基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
第一安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
对应关系确定单元,用于利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式可以为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV);
相应的,通过安装热度值确定模块确定搜索关键词所对应的各个APP标识的安装热度值,其中,所述安装热度值确定模块,可以包括:
第二安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所关联各个APP标识对应的IPA(安装APP的次数)和IUA(安装APP的用户个数);
安装热度值确定单元,用于依据第二预设公式,确定所述各个搜索关键词所关联各个APP标识所对应的安装热度值;
其中,所述第二预设公式可以为:
APP标识对应的安装热度值=log(IPA/IUA)。
具体的,所述终极关联度确定模块440,可以包括:
归一化搜索热度值确定单元,用于利用第三预设公式,对所述各个备用联想词的搜索热度值进行归一化处理,获得各个备用联想词的归一化搜索度热度值;
终极关联度确定单元,用于依据第四预设公式,确定所述各个备用联想词与所述当前关键词的终极关联度;
其中,所述第三预设公式可以为:
备用联想词的归一化搜索热度值=备用联想词的搜索热度值/(各个备用联想词作为搜索关键词时所对应各个搜索热度值中最大的搜索热度值);
所述第四预设公式可以为:
备用联想词与所述当前关键词的终极关联度=0.4*(备用联想词与当前关键词的文本相似度)+0.6*(备用联想词的归一化搜索热度值)。
具体的,所述文本搜索框内的内容更改,可以包括:
文本搜索框内的内容增加、减少或变更。
具体的,所述用户日志为各个终端定期上传到所述服务器的。
对于系统或装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (16)
1.一种信息处理方法,其特征在于,应用于服务器;所述方法包括:
获得终端发送的携带有当前关键词的关键词联想请求,其中,所述关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且所述当前关键词为所述文本搜索框内的当前内容;
确定与所述当前关键词相关的第一数量的备用联想词,其中,所述第一数量的备用联想词为将与所述当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词;
依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
依据各个备用联想词的搜索热度值和与所述当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;
将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词,其中,第二数量小于第一数量;
向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,以使得所述终端输出所述当前关键词的联想信息。
2.根据权利要求1所述的方法,其特征在于,所述向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,包括:
将所确定出的正式联想词作为所述当前关键词的联想信息反馈给所述终端。
3.根据权利要求1所述的方法,其特征在于,所述向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,包括:
依据预设的基于用户日志所确定出的搜索关键词所对应的各个APP标识的安装热度值,确定所述正式联想词中终极关联度最高的正式联想词作为搜索关键词时所对应的具有最高的安装热度值的目标APP标识;
将所述目标APP标识作为所述当前关键词的联想信息中的第一位联想信息;
将所述第一位联想信息相对应的正式联想词以外的正式联想词作为所述当前关键词的联想信息中的其余位联想信息;
向所述终端反馈所确定出的联想信息。
4.根据权利要求2所述的方法,其特征在于,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,所述搜索关键词与搜索热度值的对应关系的确定方式,包括:
确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV)。
5.根据权利要求3所述的方法,其特征在于,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,所述搜索关键词与搜索热度值的对应关系的确定方式,包括:
确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV);
相应的,所述搜索关键词所对应的各个APP标识的安装热度值的确定方式,包括:
基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所关联各个APP标识对应的IPA(安装APP的次数)和IUA(安装APP的用户个数);
依据第二预设公式,确定所述各个搜索关键词所关联各个APP标识所对应的安装热度值;
其中,所述第二预设公式为:
APP标识对应的安装热度值=log(IPA/IUA)。
6.根据权利要求1所述的方法,其特征在于,所述依据各个备用联想词的搜索热度值和与当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度,包括:
利用第三预设公式,对所述各个备用联想词的搜索热度值进行归一化处理,获得各个备用联想词的归一化搜索度热度值;
依据第四预设公式,确定所述各个备用联想词与所述当前关键词的终极关联度;
其中,所述第三预设公式为:
备用联想词的归一化搜索热度值=备用联想词的搜索热度值/(各个备用联想词作为搜索关键词时所对应各个搜索热度值中最大的搜索热度值);
所述第四预设公式为:
备用联想词与所述当前关键词的终极关联度=0.4*(备用联想词与当前关键词的文本相似度)+0.6*(备用联想词的归一化搜索热度值)。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述文本搜索框内的内容更改,包括:
文本搜索框内的内容增加、减少或变更。
8.根据权利要求1-6任意一项所述的方法,其特征在于,所述用户日志为各个终端定期上传到所述服务器的。
9.一种信息处理装置,其特征在于,应用于服务器;所述装置包括:
联想请求获得模块,用于获得终端发送的携带有当前关键词的关键词联想请求,其中,所述关键词联想请求为终端在应用市场客户端检测到文本搜索框内的内容更改后而发送的,且所述当前关键词为所述文本搜索框内的当前内容;
备用联想词确定模块,用于确定与所述当前关键词相关的第一数量的备用联想词,其中,所述第一数量的备用联想词为将与所述当前关键词具有文本相似度的联想词按照文本相似度从高到低排序后排名在前的第一数量的联想词;
搜索热度值确定模块,用于依据预设的基于用户日志确定出的搜索关键词与搜索热度值的对应关系,确定各个备用联想词作为搜索关键词时所对应的搜索热度值;
终极关联度确定模块,用于依据各个备用联想词的搜索热度值和与所述当前关键词相应的文本相似度,确定各个备用联想词与所述当前关键词的终极关联度;
正式关联词确定模块,用于将按照终极关联度降序排列后排名在前的第二数量的备用联想词确定为正式联想词,其中,第二数量小于第一数量;
联想信息发送模块,用于向所述终端反馈依据所述正式联想词确定出所述当前关键词的联想信息,以使得所述终端输出所述当前关键词的联想信息。
10.根据权利要求9所述的装置,其特征在于,所述联想信息发送模块,包括:
第一联想信息发送单元,用于将所确定出的正式联想词作为所述当前关键词的联想信息反馈给所述终端,以使得所述终端输出所述当前关键词的联想信息。
11.根据权利要求9所述的装置,其特征在于,所述联想信息发送模块,包括:
目标APP标识确定单元,用于依据预设的基于用户日志所确定出的搜索关键词所对应的各个APP标识的安装热度值,确定所述正式联想词中终极关联度最高的正式联想词作为搜索关键词时所对应的具有最高的安装热度值的目标APP标识;
第一位联想信息确定单元,用于将所述目标APP标识作为所述当前关键词的联想信息中的第一位联想信息;
其余位联想信息确定单元,用于将所述第一位联想信息相对应的正式联想词以外的正式联想词作为所述当前关键词的联想信息中的其余位联想信息;
第二联想信息发送单元,用于向所述终端反馈所确定出的联想信息。
12.根据权利要求10所述的装置,其特征在于,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,通过对应关系确定模块确定所述搜索关键词与搜索热度值的对应关系,其中,所述对应关系确定模块,包括:
搜索关键词确定单元,用于确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
搜索信息确定单元,用于基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
第一安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
对应关系确定单元,用于利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV)。
13.根据权利要求11所述的装置,其特征在于,所述用户日志包括:关于所述应用市场客户端的用户搜索日志和关于所述应用市场客户端的用户安装日志;
相应的,通过对应关系确定模块确定搜索关键词与搜索热度值的对应关系,其中,所述对应关系确定模块,包括:
搜索关键词确定单元,用于确定关于所述应用市场客户端的用户搜索日志所涉及的各个搜索关键词;
搜索信息确定单元,用于基于所述应用市场客户端的用户搜索日志,确定所述各个搜索关键词所对应的第一PV(搜索页面展现次数)和第一UV(执行搜索的用户个数);
第一安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所对应的第二PV(搜索页面展现次数)和第二UV(执行搜索的用户个数);
对应关系确定单元,用于利用第一预设公式确定所述各个搜索关键词的搜索热度值,进而建立搜索关键词与搜索热度值的对应关系;
其中,所述第一预设公式为:
搜索关键词的搜索热度值=log(第一PV/第一UV)+log(第二PV/第二UV);
相应的,通过安装热度值确定模块确定搜索关键词所对应的各个APP标识的安装热度值,其中,所述安装热度值确定模块,包括:
第二安装信息确定单元,用于基于所述应用市场客户端的用户安装日志,确定所述各个搜索关键词所关联各个APP标识对应的IPA(安装APP的次数)和IUA(安装APP的用户个数);
安装热度值确定单元,用于依据第二预设公式,确定所述各个搜索关键词所关联各个APP标识所对应的安装热度值;
其中,所述第二预设公式为:
APP标识对应的安装热度值=log(IPA/IUA)。
14.根据权利要求9所述的装置,其特征在于,所述终极关联度确定模块,包括:
归一化搜索热度值确定单元,用于利用第三预设公式,对所述各个备用联想词的搜索热度值进行归一化处理,获得各个备用联想词的归一化搜索度热度值;
终极关联度确定单元,用于依据第四预设公式,确定所述各个备用联想词与所述当前关键词的终极关联度;
其中,所述第三预设公式为:
备用联想词的归一化搜索热度值=备用联想词的搜索热度值/(各个备用联想词作为搜索关键词时所对应各个搜索热度值中最大的搜索热度值);
所述第四预设公式为:
备用联想词与所述当前关键词的终极关联度=0.4*(备用联想词与当前关键词的文本相似度)+0.6*(备用联想词的归一化搜索热度值)。
15.根据权利要求9-14任意一项所述的装置,其特征在于,所述文本搜索框内的内容更改,包括:
文本搜索框内的内容增加、减少或变更。
16.根据权利要求9-14任意一项所述的装置,其特征在于,所述用户日志为各个终端定期上传到所述服务器的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410459385.8A CN104216995B (zh) | 2014-09-10 | 2014-09-10 | 信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410459385.8A CN104216995B (zh) | 2014-09-10 | 2014-09-10 | 信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104216995A true CN104216995A (zh) | 2014-12-17 |
CN104216995B CN104216995B (zh) | 2018-03-06 |
Family
ID=52098485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410459385.8A Active CN104216995B (zh) | 2014-09-10 | 2014-09-10 | 信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104216995B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572889A (zh) * | 2014-12-24 | 2015-04-29 | 深圳市腾讯计算机系统有限公司 | 一种搜索词推荐方法、装置和系统 |
CN105159938A (zh) * | 2015-08-03 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 检索方法和装置 |
CN106033445A (zh) * | 2015-03-16 | 2016-10-19 | 北京国双科技有限公司 | 获取文章关联度数据的方法和装置 |
CN106919575A (zh) * | 2015-12-24 | 2017-07-04 | 北京奇虎科技有限公司 | 应用程序搜索方法及装置 |
CN107329583A (zh) * | 2017-06-15 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 一种计算联想词优先级的方法和装置 |
CN108170664A (zh) * | 2017-11-29 | 2018-06-15 | 有米科技股份有限公司 | 基于重点关键词的关键词拓展方法和装置 |
WO2019056324A1 (zh) * | 2017-09-22 | 2019-03-28 | 深圳市云中飞网络科技有限公司 | 推荐联想词的方法、移动终端以及计算机可读存储介质 |
CN112347340A (zh) * | 2020-11-17 | 2021-02-09 | 平安数字信息科技(深圳)有限公司 | 信息搜索方法、装置和计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063508A (zh) * | 2011-01-10 | 2011-05-18 | 浙江大学 | 基于广义后缀树的中文搜索引擎模糊自动补全方法 |
US20120271843A1 (en) * | 2011-04-19 | 2012-10-25 | International Business Machines Corporation | Computer Processing Method and System for Searching |
CN103488780A (zh) * | 2013-09-27 | 2014-01-01 | 中国联合网络通信集团有限公司 | 应用程序搜索方法和装置 |
CN103617075A (zh) * | 2013-12-04 | 2014-03-05 | 百度在线网络技术(北京)有限公司 | 应用程序推荐方法、系统和服务器 |
-
2014
- 2014-09-10 CN CN201410459385.8A patent/CN104216995B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063508A (zh) * | 2011-01-10 | 2011-05-18 | 浙江大学 | 基于广义后缀树的中文搜索引擎模糊自动补全方法 |
US20120271843A1 (en) * | 2011-04-19 | 2012-10-25 | International Business Machines Corporation | Computer Processing Method and System for Searching |
CN103488780A (zh) * | 2013-09-27 | 2014-01-01 | 中国联合网络通信集团有限公司 | 应用程序搜索方法和装置 |
CN103617075A (zh) * | 2013-12-04 | 2014-03-05 | 百度在线网络技术(北京)有限公司 | 应用程序推荐方法、系统和服务器 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572889A (zh) * | 2014-12-24 | 2015-04-29 | 深圳市腾讯计算机系统有限公司 | 一种搜索词推荐方法、装置和系统 |
CN106033445A (zh) * | 2015-03-16 | 2016-10-19 | 北京国双科技有限公司 | 获取文章关联度数据的方法和装置 |
CN106033445B (zh) * | 2015-03-16 | 2019-10-25 | 北京国双科技有限公司 | 获取文章关联度数据的方法和装置 |
CN105159938B (zh) * | 2015-08-03 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 检索方法和装置 |
CN105159938A (zh) * | 2015-08-03 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 检索方法和装置 |
CN106919575A (zh) * | 2015-12-24 | 2017-07-04 | 北京奇虎科技有限公司 | 应用程序搜索方法及装置 |
CN107329583A (zh) * | 2017-06-15 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 一种计算联想词优先级的方法和装置 |
WO2019056324A1 (zh) * | 2017-09-22 | 2019-03-28 | 深圳市云中飞网络科技有限公司 | 推荐联想词的方法、移动终端以及计算机可读存储介质 |
CN110799963A (zh) * | 2017-09-22 | 2020-02-14 | 深圳市欢太科技有限公司 | 推荐联想词的方法、移动终端以及计算机可读存储介质 |
CN108170664A (zh) * | 2017-11-29 | 2018-06-15 | 有米科技股份有限公司 | 基于重点关键词的关键词拓展方法和装置 |
CN108170664B (zh) * | 2017-11-29 | 2021-04-09 | 有米科技股份有限公司 | 基于重点关键词的关键词拓展方法和装置 |
CN112347340A (zh) * | 2020-11-17 | 2021-02-09 | 平安数字信息科技(深圳)有限公司 | 信息搜索方法、装置和计算机设备 |
CN112347340B (zh) * | 2020-11-17 | 2023-06-27 | 深圳平安智汇企业信息管理有限公司 | 信息搜索方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN104216995B (zh) | 2018-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104216995A (zh) | 信息处理方法及装置 | |
CN110825957A (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
US20210081847A1 (en) | Method of training random forest model, electronic device and storage medium | |
CN104142999A (zh) | 搜索结果展示方法及装置 | |
CN102890683B (zh) | 信息提供方法及装置 | |
CN105005582A (zh) | 多媒体信息的推荐方法及装置 | |
CN105574062A (zh) | 一种文件检索方法、装置以及终端 | |
CN105718284A (zh) | 一种用于通信终端的应用程序启动方法及装置 | |
WO2015185020A1 (en) | Information category obtaining method and apparatus | |
CN104142990A (zh) | 搜索方法及装置 | |
CN106649210B (zh) | 一种数据转换方法及装置 | |
CN103198091B (zh) | 一种基于用户行为的在线数据请求的处理方法和设备 | |
CN103870553A (zh) | 一种输入资源推送方法及系统 | |
CN105022807A (zh) | 信息推荐方法及装置 | |
CN103235719A (zh) | 建立wap网站的方法和装置 | |
CN104639974A (zh) | 一种信息推送方法及装置 | |
WO2022001233A1 (zh) | 基于层次化迁移学习的预标注方法及其相关设备 | |
CN114064925A (zh) | 知识图谱的构建方法、数据查询方法、装置、设备和介质 | |
CN104572707A (zh) | 一种用于提供优选对象信息的方法与设备 | |
CN105760528A (zh) | 一种信息处理方法以及装置 | |
CN103399879A (zh) | 基于用户搜索日志的兴趣实体获得方法及装置 | |
CN111832589A (zh) | 一种多级分类对象的分类方法和装置 | |
US10460018B1 (en) | System for determining layouts of webpages | |
CN102479218A (zh) | 通过api接口进行快递查询的方法和服务器 | |
CN105653533A (zh) | 一种更新分类关联词集合的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |