CN107633073A - 资源确定方法、装置及系统 - Google Patents

资源确定方法、装置及系统 Download PDF

Info

Publication number
CN107633073A
CN107633073A CN201710868843.7A CN201710868843A CN107633073A CN 107633073 A CN107633073 A CN 107633073A CN 201710868843 A CN201710868843 A CN 201710868843A CN 107633073 A CN107633073 A CN 107633073A
Authority
CN
China
Prior art keywords
query
history
current
resource
current query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710868843.7A
Other languages
English (en)
Inventor
杜骁淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Alibaba Literature Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Alibaba Literature Information Technology Co Ltd filed Critical Guangzhou Alibaba Literature Information Technology Co Ltd
Priority to CN201710868843.7A priority Critical patent/CN107633073A/zh
Publication of CN107633073A publication Critical patent/CN107633073A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种资源确定方法、装置及系统。资源确定方法包括:获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。本发明提高了资源确定的效率、资源的点击率、资源的转换率。

Description

资源确定方法、装置及系统
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种资源确定方法、装置及系统。
背景技术
随着数字内容的快速发展,越来越多的人关注和阅读数字内容,同时阅读方式逐渐演变为在线阅读。
手机、掌上电脑等多种移动终端智能化程度越来越高,以及无线网络的覆盖区域越来越广泛,使得信息的发布更加实时,导致人们越来越习惯在线阅读报纸、新闻、电子书以及原创内容等数字内容。
为了便于用户能找到并阅读其感兴趣的数字内容,通常给用户开放了搜索的权限,即用户通过搜索既可以找到其关注的数字内容,但是,对于任一款实现在线阅读的产品来说,由于其资源数据量较为庞大,导致搜索的效率、资源的点击率、资源的转换率有待进一步提高。
发明内容
有鉴于此,本发明实施例所解决的技术问题之一在于提供一种资源确定方法、装置及系统,用以克服或者缓解现有技术中的上述技术缺陷。
本发明实施例提供了一种资源确定方法,其包括:
获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
可选地,在本发明的任一实施例中,对当前query进行分析可以包括:对当前query的关键词进行语义分析;
对应地,确定所述当前query与历史query的相关性包括:根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,对当前query进行分析还可以包括:根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
可选地,在本发明的任一实施例中,对当前query进行分析,以确定所述当前query与历史query的相关性可以包括:
对历史query进行时效性分析,以确定历史query的可信度;
根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,从所述历史query中选择与所述当前query匹配的资源可以包括:根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
可选地,在本发明的任一实施例中,对当前query进行分析,以确定所述当前query与历史query的相关性可以包括:
对当前query进行分析,确定满足当前query的候选资源;
确定满足历史query的候选资源;
根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,对当前query进行分析,以确定所述当前query与历史query的相关性可以包括:
对当前query进行分析,确定当前query的消费资源;
确定满足历史query的消费资源;
根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,资源确定方法还可以包括:对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
对应地,根据所述当前query与历史query的相关性,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性包括:
根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
可选地,在本发明的任一实施例中,所述资源包括数字化可读资源。
本发明实施例还提供一种资源确定装置,其包括:
相关性确定模块,用于获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
相似性确定模块,用于根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
匹配模块,用于根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
可选地,在本发明的任一实施例中,所述相关性确定模块还可以进一步用于对当前query的关键词进行语义分析;
对应地,所述相似性确定模块还可以进一步用于根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,所述相似性确定模块可以包括:
可信度确定单元,用于对历史query进行时效性分析,以确定历史query的可信度;
相似性确定单元,用于根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,所述匹配模块还可以进一步用于根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
可选地,在本发明的任一实施例中,所述相关性确定模块可以包括:
第一候选资源确定单元,用于对当前query进行分析,确定满足当前query的候选资源;
第二候选资源确定单元,用于确定满足历史query的候选资源;
相关性确定单元,用于根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,所述相关性确定模块可以包括:
第一消费资源确定单元,用于对当前query进行分析,确定当前query的消费资源;
第二消费资源确定单元,用于确定满足历史query的消费资源;
相关性确定单元,用于根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,资源确定装置还可以包括矫正模块,用于根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
可选地,在本发明的任一实施例中,资源确定装置还可以绑定单元,用于对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
对应地,所述相似性确定模块进一步用于:根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
本发明实施例还提供一种资源确定系统,其包括:客户端以及后台服务器,其中,
所述客户端用于:收集在其上发起的当前query;
所述后台服务器用于:获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;以及根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本发明实施例中,通过获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;再根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;最后根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源,从而进一步提高了资源确定的效率、资源的点击率、资源的转换率。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本发明实施例的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1为本发明实施例一中资源确定方法流程示意图;
图2为本发明实施例二中资源确定方法流程示意图;
图3为本发明实施例三中资源确定方法流程示意图;
图4为本发明实施例四中资源确定装置结构示意图;
图5为本发明实施例五中资源确定装置结构示意图;
图6为本发明实施例六中资源确定装置结构示意图;
图7为本发明实施例七中资源确定系统结构示意图。
具体实施方式
实施本发明实施例的任一技术方案必不一定需要同时达到以上的所有优点。
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
本发明实施例中,通过获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;再根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;最后根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源,从而进一步提高了资源确定的效率、资源的点击率、资源的转换率。
图1为本发明实施例一中资源确定方法流程示意图;如图1所示,其包括:
S101、获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
本实施例中,客户端具体可以包括安装在终端上的应用程序,当前query具体可以包括用户在客户端的页面中输入关键词进行资源检索的过程。
本实施例中,步骤S101中对当前query进行分析时,具体可对当前query的关键词进行语义分析。在进行语义分析时,可包括:对输入的关键词进行切分,比如通过最大正向、最大反向、马尔科夫、CRF模型等方式进行切词,在进行核心关键词的提取和权重分配等,从而完成语义分析处理。
对应地,本实施例中,步骤S101中确定所述当前query与历史query的相关性时,可以根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。具体地,在确定当前query的关键词与历史query的关键词时,可以通过当前query的关键词与历史query的关键词中核心关键词的重合度来进行确定,两者核心关键词的重合度越高,则相似度越高,反之,则越低。
本实施例中,在后台服务器上存储有历史query,进一步地包括发起该历史query的用户以及其对应的候选资源,即用户在客户端输入关键词,后台服务器根据关键词匹配的资源,这些搜索结果可能并非是用户最终选择要消费的资源。比如,在电子书阅读app的搜索页面中输入关键词检索相关的电子书籍时,从电子书籍数据库中匹配并呈现给用户进行选择阅读的电子书籍。
另外,在具体应用时,考虑到用户在输入关键词的时候,会发生错误,因此,步骤S101中对当前query进行分析时,还可以包括:根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。可选地,在进行矫正时,具体可以根据语义分析的结果进行校正,其中,尤其对从关键词切分出的核心关键词进行矫正。
本实施例中,在步骤S101中对当前query进行分析,以确定所述当前query与历史query的相关性时,具体可以包括:
对历史query进行时效性分析,以确定历史query的可信度;
根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
本实施例中,通过上述时效性分析确定历史query的可信度,从而避免了时间较早的历史query造成的干扰较大而导致的在匹配资源时,准确度较差。具体地,所述可信度可以通过权重来体现,可信度越高,则权重值越大,可信度越低,则权重值越小。
在具体应用场景中,在时间上,历史query距离当前query越近,则时效性越好,对应地,可行度越高,反之可信度越低。可信度高的历史query与当前query的相关性也就越高,反之,则相关性越低。
S102、根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
本实施例中,每次在客户端有用户发起query时,可以对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定。在具体应用时,可以通过建立索引的方式对所述当前query以及其对应的用户、对历史query以及其对应的用户身份进行绑定。
需要说明的是,此处所谓用户身份可以是在后台服务器上登记注册的用户身份,也可以是后台服务器每获取到一个query自动分配的用户身份。
对应地,本实施例中,步骤S102中,根据所述当前query与历史query的相关性,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性时,具体可以包括:根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
本实施例中,通过对用户进行相似性确定,从而确定出用户的群体类似性,进而得到其需求的类似性,以在后续资源匹配时,可以提高资源匹配的准确率以及效率,进一步提高资源的点击率和转换率。
S103、根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,步骤S103中从所述历史query中选择与所述当前query匹配的资源时,可以具体包括:根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
本实施例中,在匹配资源时,通过资源的热度值进一步提高了资源匹配的准确率和效率。在具体应用时,可以通过对资源的点击率以及转化率进行统计从而得到资源的热度值。
图2为本发明实施例二中资源确定方法流程示意图;如图2所示,本实施例中,主要针对在资源搜索过程中,当前query和历史query的相关性进行资源匹配,其具体包括如下步骤S111A-S103:
S111A、对当前query进行分析,确定满足当前query的候选资源;
本实施例中,对当前query进行分析类似上述实施例。
本实施例中,所述候选资源具体包括后台服务器根据当前query对应的关键词在资源库中匹配到的资源,该资源呈现给用户进行选择。
比如,若将本实施例的技术方案应用到电子书阅读APP的话,所述候选资源具体可以指返回至搜索页面的且与当前query的关键词匹配的电子书籍。
S121A、确定满足历史query的候选资源;
历史query的候选资源类似上述当前query的候选资源。
S131A、根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
本实施例中,如果满足当前query的候选资源以及满足历史query的候选资源重合度或者是相似度较高,则所述当前query与历史query的相关性较强,否则,所述当前query与历史query的相关性较弱。
在具体实施时,可以具体根据满足当前query的候选资源以及满足历史query的候选资源重合度或者是相似度,比如,候选资源的重合度大于设定的阈值,则可直接确定所述当前query与历史query具有相关性。或者,根据候选资源的重合度大于设定阈值,且根据候选资源的重合度大小进行相关性大小的赋值,重合度越高,给相关性的赋值越大,否则越小。
S102、根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
本实施例中,如前所述,若所述当前query与历史query的相关性越大,则所述历史query与所述当前query的用户属于同一群体的可能越大,在具体实施时,可以对该可能性进行赋值,当可能性的赋值大于设定阈值时,则可判定所述历史query与所述当前query对应用户具有相似性。具体实施,还可以对该相似性进行赋值,以表示相似度的大小。
S103、根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,在匹配时,对相似性进行大小排序,按照从相似性从到小的顺序,从对应所述历史query中选择与所述当前query匹配的资源。
图3为本发明实施例三中资源确定方法流程示意图;如图3所示,本实施例中,主要针对在完成资源搜索之后,根据用户实际的消费资源,对当前query和历史query的相关性进行资源匹配,其包括:
S111B、对当前query进行分析,确定当前query的消费资源;
本实施例中,所谓消费资源具体是指用户从候选资源中选出并进行了实际使用的资源,比如,如果是电子书籍的话,则指用户阅读了的电子书籍。
S121B、确定满足历史query的消费资源;
S131B、根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
S102、根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
S103、根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,与上述实施例二不同的是,是将本发明的技术方案运用到了资源的消费过程中,而具体的技术思路跟上述实施例二类似。
需要说明的是,上述实施例中,所述资源包括诸如为电子书籍的数字化可读资源,但是,需要说明的是,也可以包括其他数字化可读资源,比如报刊、杂志等。
图4为本发明实施例四中资源确定装置结构示意图;如图4所示,其包括:
相关性确定模块401,用于获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
相似性确定模块402,用于根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
匹配模块403,用于根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,所述相关性确定模块401进一步用于对当前query的关键词进行语义分析;对应地,所述相似性确定模块402进一步用于根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
对应地,所述相似性确定模块402进一步用于:根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
本实施例或其他任一实施例中,所述匹配模块403进一步用于根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
本实施例或者其他实施例中,还可以包括:矫正模块(图中未示出),用于根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
本实施例或者其他实施例中,还可以包括:绑定单元,用于对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
本实施例中,所述相似性确定模块402包括:
可信度确定单元,用于对历史query进行时效性分析,以确定历史query的可信度;
相似性确定单元,用于根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
图5为本发明实施例五中资源确定装置结构示意图;如图5所示,相似性确定模块402和匹配模块403类似上述实施例,与上述实施例不同的是其中所述相关性确定模块401包括:
第一候选资源确定单元411A,用于对当前query进行分析,确定满足当前query的候选资源;
第二候选资源确定单元421A,用于确定满足历史query的候选资源;
相关性确定单元431A,用于根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
图6为本发明实施例六中资源确定装置结构示意图;如图6所示,相似性确定模块402和匹配模块403类似上述实施例,与上述实施例不同的是其中所述相关性确定模块401包括:
第一消费资源确定单元411B,用于对当前query进行分析,确定当前query的消费资源;
第二消费资源确定单元421B,用于确定满足历史query的消费资源;
相关性确定单元431B,用于根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
图7为本发明实施例七中资源确定系统结构示意图;如图7所示,其包括客户端701以及后台服务器702,其中,
所述客户端701用于:收集在其上发起的当前query;
所述后台服务器702用于:获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;以及根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
在一资源确定系统的一具体应用中,在后台服务器702上配置上述图4-图6任一实施例的资源确定装置。
需要说明的是,上述资源确定装置并非必须配置在后台服务器702上,也可以配置在客户端701。
本实施例中,客户端泛指应用程序,也包括网页。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,所述计算机可读记录介质包括用于以计算机(例如计算机)可读的形式存储或传送信息的任何机制。例如,机器可读介质包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪速存储介质、电、光、声或其他形式的传播信号(例如,载波、红外信号、数字信号等)等,该计算机软件产品包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
本领域的技术人员应明白,本发明实施例的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims (18)

1.一种资源确定方法,其特征在于,包括:
获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
2.根据权利要求1所述的资源确定方法,其特征在于,对当前query进行分析包括:对当前query的关键词进行语义分析;
对应地,确定所述当前query与历史query的相关性包括:根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
3.根据权利要求2所述的资源确定方法,其特征在于,对当前query进行分析还包括:根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
4.根据权利要求1所述的资源确定方法,其特征在于,对当前query进行分析,以确定所述当前query与历史query的相关性包括:
对历史query进行时效性分析,以确定历史query的可信度;
根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
5.根据权利要求1所述的资源确定方法,其特征在于,从所述历史query中选择与所述当前query匹配的资源包括:根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
6.根据权利要求1所述的资源确定方法,其特征在于,对当前query进行分析,以确定所述当前query与历史query的相关性包括:
对当前query进行分析,确定满足当前query的候选资源;
确定满足历史query的候选资源;
根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
7.根据权利要求1所述的资源确定方法,其特征在于,对当前query进行分析,以确定所述当前query与历史query的相关性包括:
对当前query进行分析,确定当前query的消费资源;
确定满足历史query的消费资源;
根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
8.根据权利要求1所述的资源确定方法,其特征在于,还包括:对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
对应地,根据所述当前query与历史query的相关性,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性包括:
根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
9.根据权利要求1-8任一项所述的资源确定方法,其特征在于,所述资源包括数字化可读资源。
10.一种资源确定装置,其特征在于,包括:
相关性确定模块,用于获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
相似性确定模块,用于根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
匹配模块,用于根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
11.根据权利要求10所述的资源确定装置,其特征在于,所述相关性确定模块进一步用于对当前query的关键词进行语义分析;
对应地,所述相似性确定模块进一步用于根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
12.根据权利要求10所述的资源确定装置,其特征在于,所述相似性确定模块包括:
可信度确定单元,用于对历史query进行时效性分析,以确定历史query的可信度;
相似性确定单元,用于根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
13.根据权利要求10所述的资源确定装置,其特征在于,所述匹配模块进一步用于根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
14.根据权利要求10所述的资源确定装置,其特征在于,所述相关性确定模块包括:
第一候选资源确定单元,用于对当前query进行分析,确定满足当前query的候选资源;
第二候选资源确定单元,用于确定满足历史query的候选资源;
相关性确定单元,用于根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
15.根据权利要求10所述的资源确定装置,其特征在于,所述相关性确定模块包括:
第一消费资源确定单元,用于对当前query进行分析,确定当前query的消费资源;
第二消费资源确定单元,用于确定满足历史query的消费资源;
相关性确定单元,用于根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
16.根据权利要求15所述的资源确定装置,其特征在于,还包括矫正模块,用于根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
17.根据权利要求10所述的资源确定装置,其特征在于,还包括绑定单元,用于对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
对应地,所述相似性确定模块进一步用于:根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
18.一种资源确定系统,其特征在于,包括:客户端以及后台服务器,其中,
所述客户端用于:收集在其上发起的当前query;
所述后台服务器用于:获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;以及根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
CN201710868843.7A 2017-09-22 2017-09-22 资源确定方法、装置及系统 Pending CN107633073A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710868843.7A CN107633073A (zh) 2017-09-22 2017-09-22 资源确定方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710868843.7A CN107633073A (zh) 2017-09-22 2017-09-22 资源确定方法、装置及系统

Publications (1)

Publication Number Publication Date
CN107633073A true CN107633073A (zh) 2018-01-26

Family

ID=61103587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710868843.7A Pending CN107633073A (zh) 2017-09-22 2017-09-22 资源确定方法、装置及系统

Country Status (1)

Country Link
CN (1) CN107633073A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
CN102402589A (zh) * 2011-10-26 2012-04-04 北京百度网讯科技有限公司 一种提供与搜索请求相关的参考搜索信息的方法与设备
CN102419778A (zh) * 2012-01-09 2012-04-18 中国科学院软件研究所 一种挖掘查询语句子话题并聚类的信息搜索方法
CN105787770A (zh) * 2016-04-27 2016-07-20 上海遥薇(集团)有限公司 一种基于nmf算法的大数据商品及服务推荐方法及系统
US20160253750A1 (en) * 2014-12-22 2016-09-01 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
CN106326318A (zh) * 2015-07-10 2017-01-11 阿里巴巴集团控股有限公司 搜索方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
CN102402589A (zh) * 2011-10-26 2012-04-04 北京百度网讯科技有限公司 一种提供与搜索请求相关的参考搜索信息的方法与设备
CN102419778A (zh) * 2012-01-09 2012-04-18 中国科学院软件研究所 一种挖掘查询语句子话题并聚类的信息搜索方法
US20160253750A1 (en) * 2014-12-22 2016-09-01 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
CN106326318A (zh) * 2015-07-10 2017-01-11 阿里巴巴集团控股有限公司 搜索方法及装置
CN105787770A (zh) * 2016-04-27 2016-07-20 上海遥薇(集团)有限公司 一种基于nmf算法的大数据商品及服务推荐方法及系统

Similar Documents

Publication Publication Date Title
US11727066B2 (en) Apparatus, system, and method for natural language processing
WO2020140633A1 (zh) 文本主题提取方法、装置、电子设备及存储介质
CN107832432A (zh) 一种搜索结果排序方法、装置、服务器和存储介质
US9087108B2 (en) Determination of category information using multiple stages
CN111177569A (zh) 基于人工智能的推荐处理方法、装置及设备
US10346494B2 (en) Search engine system communicating with a full text search engine to retrieve most similar documents
US10482146B2 (en) Systems and methods for automatic customization of content filtering
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
CN110019647A (zh) 一种关键词搜索方法、装置和搜索引擎
CN107943792B (zh) 一种语句分析方法、装置及终端设备、存储介质
CN106951503A (zh) 信息提供方法、装置、设备以及存储介质
US9418058B2 (en) Processing method for social media issue and server device supporting the same
CN115455171B (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
CN107291337A (zh) 一种提供业务访问的方法及装置
CN109933708A (zh) 信息检索方法、装置、存储介质及计算机设备
CN109918627A (zh) 文本生成方法、装置、电子设备及存储介质
CN110083683B (zh) 基于随机游走的实体语义标注方法
CN106709055A (zh) 一种图片试题的处理方法及装置
CN113722438A (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN110909120A (zh) 简历搜索/投递方法、装置、系统及电子设备
CN112632261A (zh) 智能问答方法、装置、设备及存储介质
CN112784590A (zh) 文本处理方法及装置
CN110377803B (zh) 信息处理方法以及装置
CN109960752A (zh) 应用程序内的查询方法、装置、计算机设备和存储介质
CN105608183A (zh) 一种提供聚合类型回答的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200604

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 13 layer self unit 03

Applicant before: GUANGZHOU ALIBABA LITERATURE INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20180126

RJ01 Rejection of invention patent application after publication