发明内容
有鉴于此,本发明实施例所解决的技术问题之一在于提供一种资源确定方法、装置及系统,用以克服或者缓解现有技术中的上述技术缺陷。
本发明实施例提供了一种资源确定方法,其包括:
获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
可选地,在本发明的任一实施例中,对当前query进行分析可以包括:对当前query的关键词进行语义分析;
对应地,确定所述当前query与历史query的相关性包括:根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,对当前query进行分析还可以包括:根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
可选地,在本发明的任一实施例中,对当前query进行分析,以确定所述当前query与历史query的相关性可以包括:
对历史query进行时效性分析,以确定历史query的可信度;
根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,从所述历史query中选择与所述当前query匹配的资源可以包括:根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
可选地,在本发明的任一实施例中,对当前query进行分析,以确定所述当前query与历史query的相关性可以包括:
对当前query进行分析,确定满足当前query的候选资源;
确定满足历史query的候选资源;
根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,对当前query进行分析,以确定所述当前query与历史query的相关性可以包括:
对当前query进行分析,确定当前query的消费资源;
确定满足历史query的消费资源;
根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,资源确定方法还可以包括:对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
对应地,根据所述当前query与历史query的相关性,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性包括:
根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
可选地,在本发明的任一实施例中,所述资源包括数字化可读资源。
本发明实施例还提供一种资源确定装置,其包括:
相关性确定模块,用于获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
相似性确定模块,用于根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
匹配模块,用于根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
可选地,在本发明的任一实施例中,所述相关性确定模块还可以进一步用于对当前query的关键词进行语义分析;
对应地,所述相似性确定模块还可以进一步用于根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,所述相似性确定模块可以包括:
可信度确定单元,用于对历史query进行时效性分析,以确定历史query的可信度;
相似性确定单元,用于根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,所述匹配模块还可以进一步用于根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
可选地,在本发明的任一实施例中,所述相关性确定模块可以包括:
第一候选资源确定单元,用于对当前query进行分析,确定满足当前query的候选资源;
第二候选资源确定单元,用于确定满足历史query的候选资源;
相关性确定单元,用于根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,所述相关性确定模块可以包括:
第一消费资源确定单元,用于对当前query进行分析,确定当前query的消费资源;
第二消费资源确定单元,用于确定满足历史query的消费资源;
相关性确定单元,用于根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
可选地,在本发明的任一实施例中,资源确定装置还可以包括矫正模块,用于根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
可选地,在本发明的任一实施例中,资源确定装置还可以绑定单元,用于对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
对应地,所述相似性确定模块进一步用于:根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
本发明实施例还提供一种资源确定系统,其包括:客户端以及后台服务器,其中,
所述客户端用于:收集在其上发起的当前query;
所述后台服务器用于:获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;以及根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本发明实施例中,通过获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;再根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;最后根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源,从而进一步提高了资源确定的效率、资源的点击率、资源的转换率。
具体实施方式
实施本发明实施例的任一技术方案必不一定需要同时达到以上的所有优点。
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
本发明实施例中,通过获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;再根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;最后根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源,从而进一步提高了资源确定的效率、资源的点击率、资源的转换率。
图1为本发明实施例一中资源确定方法流程示意图;如图1所示,其包括:
S101、获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
本实施例中,客户端具体可以包括安装在终端上的应用程序,当前query具体可以包括用户在客户端的页面中输入关键词进行资源检索的过程。
本实施例中,步骤S101中对当前query进行分析时,具体可对当前query的关键词进行语义分析。在进行语义分析时,可包括:对输入的关键词进行切分,比如通过最大正向、最大反向、马尔科夫、CRF模型等方式进行切词,在进行核心关键词的提取和权重分配等,从而完成语义分析处理。
对应地,本实施例中,步骤S101中确定所述当前query与历史query的相关性时,可以根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。具体地,在确定当前query的关键词与历史query的关键词时,可以通过当前query的关键词与历史query的关键词中核心关键词的重合度来进行确定,两者核心关键词的重合度越高,则相似度越高,反之,则越低。
本实施例中,在后台服务器上存储有历史query,进一步地包括发起该历史query的用户以及其对应的候选资源,即用户在客户端输入关键词,后台服务器根据关键词匹配的资源,这些搜索结果可能并非是用户最终选择要消费的资源。比如,在电子书阅读app的搜索页面中输入关键词检索相关的电子书籍时,从电子书籍数据库中匹配并呈现给用户进行选择阅读的电子书籍。
另外,在具体应用时,考虑到用户在输入关键词的时候,会发生错误,因此,步骤S101中对当前query进行分析时,还可以包括:根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。可选地,在进行矫正时,具体可以根据语义分析的结果进行校正,其中,尤其对从关键词切分出的核心关键词进行矫正。
本实施例中,在步骤S101中对当前query进行分析,以确定所述当前query与历史query的相关性时,具体可以包括:
对历史query进行时效性分析,以确定历史query的可信度;
根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
本实施例中,通过上述时效性分析确定历史query的可信度,从而避免了时间较早的历史query造成的干扰较大而导致的在匹配资源时,准确度较差。具体地,所述可信度可以通过权重来体现,可信度越高,则权重值越大,可信度越低,则权重值越小。
在具体应用场景中,在时间上,历史query距离当前query越近,则时效性越好,对应地,可行度越高,反之可信度越低。可信度高的历史query与当前query的相关性也就越高,反之,则相关性越低。
S102、根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
本实施例中,每次在客户端有用户发起query时,可以对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定。在具体应用时,可以通过建立索引的方式对所述当前query以及其对应的用户、对历史query以及其对应的用户身份进行绑定。
需要说明的是,此处所谓用户身份可以是在后台服务器上登记注册的用户身份,也可以是后台服务器每获取到一个query自动分配的用户身份。
对应地,本实施例中,步骤S102中,根据所述当前query与历史query的相关性,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性时,具体可以包括:根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
本实施例中,通过对用户进行相似性确定,从而确定出用户的群体类似性,进而得到其需求的类似性,以在后续资源匹配时,可以提高资源匹配的准确率以及效率,进一步提高资源的点击率和转换率。
S103、根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,步骤S103中从所述历史query中选择与所述当前query匹配的资源时,可以具体包括:根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
本实施例中,在匹配资源时,通过资源的热度值进一步提高了资源匹配的准确率和效率。在具体应用时,可以通过对资源的点击率以及转化率进行统计从而得到资源的热度值。
图2为本发明实施例二中资源确定方法流程示意图;如图2所示,本实施例中,主要针对在资源搜索过程中,当前query和历史query的相关性进行资源匹配,其具体包括如下步骤S111A-S103:
S111A、对当前query进行分析,确定满足当前query的候选资源;
本实施例中,对当前query进行分析类似上述实施例。
本实施例中,所述候选资源具体包括后台服务器根据当前query对应的关键词在资源库中匹配到的资源,该资源呈现给用户进行选择。
比如,若将本实施例的技术方案应用到电子书阅读APP的话,所述候选资源具体可以指返回至搜索页面的且与当前query的关键词匹配的电子书籍。
S121A、确定满足历史query的候选资源;
历史query的候选资源类似上述当前query的候选资源。
S131A、根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
本实施例中,如果满足当前query的候选资源以及满足历史query的候选资源重合度或者是相似度较高,则所述当前query与历史query的相关性较强,否则,所述当前query与历史query的相关性较弱。
在具体实施时,可以具体根据满足当前query的候选资源以及满足历史query的候选资源重合度或者是相似度,比如,候选资源的重合度大于设定的阈值,则可直接确定所述当前query与历史query具有相关性。或者,根据候选资源的重合度大于设定阈值,且根据候选资源的重合度大小进行相关性大小的赋值,重合度越高,给相关性的赋值越大,否则越小。
S102、根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
本实施例中,如前所述,若所述当前query与历史query的相关性越大,则所述历史query与所述当前query的用户属于同一群体的可能越大,在具体实施时,可以对该可能性进行赋值,当可能性的赋值大于设定阈值时,则可判定所述历史query与所述当前query对应用户具有相似性。具体实施,还可以对该相似性进行赋值,以表示相似度的大小。
S103、根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,在匹配时,对相似性进行大小排序,按照从相似性从到小的顺序,从对应所述历史query中选择与所述当前query匹配的资源。
图3为本发明实施例三中资源确定方法流程示意图;如图3所示,本实施例中,主要针对在完成资源搜索之后,根据用户实际的消费资源,对当前query和历史query的相关性进行资源匹配,其包括:
S111B、对当前query进行分析,确定当前query的消费资源;
本实施例中,所谓消费资源具体是指用户从候选资源中选出并进行了实际使用的资源,比如,如果是电子书籍的话,则指用户阅读了的电子书籍。
S121B、确定满足历史query的消费资源;
S131B、根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
S102、根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
S103、根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,与上述实施例二不同的是,是将本发明的技术方案运用到了资源的消费过程中,而具体的技术思路跟上述实施例二类似。
需要说明的是,上述实施例中,所述资源包括诸如为电子书籍的数字化可读资源,但是,需要说明的是,也可以包括其他数字化可读资源,比如报刊、杂志等。
图4为本发明实施例四中资源确定装置结构示意图;如图4所示,其包括:
相关性确定模块401,用于获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;
相似性确定模块402,用于根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;
匹配模块403,用于根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
本实施例中,所述相关性确定模块401进一步用于对当前query的关键词进行语义分析;对应地,所述相似性确定模块402进一步用于根据对当前query的关键词进行语义分析的结果,确定所述历史query中的关键词与所述当前query的关键词的相似度,以根据所述相似度确定所述当前query与历史query的相关性。
对应地,所述相似性确定模块402进一步用于:根据所述当前query与历史query的相关性,以及当前query、历史query与各自用户身份的绑定关系,对发起所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性。
本实施例或其他任一实施例中,所述匹配模块403进一步用于根据所述资源的热度值,从所述历史query中选择与所述当前query匹配的所述资源。
本实施例或者其他实施例中,还可以包括:矫正模块(图中未示出),用于根据所述语义分析的结果,对所述关键词进行矫正,以确定所述历史query中的关键词与所述当前query的矫正后的关键词的相似度。
本实施例或者其他实施例中,还可以包括:绑定单元,用于对所述当前query以及其对应的用户身份进行绑定,对历史query以及其对应的用户身份进行绑定;
本实施例中,所述相似性确定模块402包括:
可信度确定单元,用于对历史query进行时效性分析,以确定历史query的可信度;
相似性确定单元,用于根据所述历史query的可信度以及对当前query的分析结果,确定所述当前query与历史query的相关性。
图5为本发明实施例五中资源确定装置结构示意图;如图5所示,相似性确定模块402和匹配模块403类似上述实施例,与上述实施例不同的是其中所述相关性确定模块401包括:
第一候选资源确定单元411A,用于对当前query进行分析,确定满足当前query的候选资源;
第二候选资源确定单元421A,用于确定满足历史query的候选资源;
相关性确定单元431A,用于根据满足当前query的候选资源以及满足历史query的候选资源,确定所述当前query与历史query的相关性。
图6为本发明实施例六中资源确定装置结构示意图;如图6所示,相似性确定模块402和匹配模块403类似上述实施例,与上述实施例不同的是其中所述相关性确定模块401包括:
第一消费资源确定单元411B,用于对当前query进行分析,确定当前query的消费资源;
第二消费资源确定单元421B,用于确定满足历史query的消费资源;
相关性确定单元431B,用于根据当前query的消费资源以及历史query的消费资源,确定所述当前query与历史query的相关性。
图7为本发明实施例七中资源确定系统结构示意图;如图7所示,其包括客户端701以及后台服务器702,其中,
所述客户端701用于:收集在其上发起的当前query;
所述后台服务器702用于:获取在客户端发起的当前query并对当前query进行分析,以确定所述当前query与历史query的相关性,所述历史query与所述当前query由不同的用户发起;根据所述当前query与历史query的相关性,对所述历史query与所述当前query的用户进行聚类分析,以确定所述历史query与所述当前query对应用户的相似性;以及根据所述历史query与所述当前query对应用户的相似性,从所述历史query中选择与所述当前query匹配的资源。
在一资源确定系统的一具体应用中,在后台服务器702上配置上述图4-图6任一实施例的资源确定装置。
需要说明的是,上述资源确定装置并非必须配置在后台服务器702上,也可以配置在客户端701。
本实施例中,客户端泛指应用程序,也包括网页。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,所述计算机可读记录介质包括用于以计算机(例如计算机)可读的形式存储或传送信息的任何机制。例如,机器可读介质包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪速存储介质、电、光、声或其他形式的传播信号(例如,载波、红外信号、数字信号等)等,该计算机软件产品包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
本领域的技术人员应明白,本发明实施例的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。