CN105354261A - 一种数字资源推荐方法及装置 - Google Patents

一种数字资源推荐方法及装置 Download PDF

Info

Publication number
CN105354261A
CN105354261A CN201510695883.7A CN201510695883A CN105354261A CN 105354261 A CN105354261 A CN 105354261A CN 201510695883 A CN201510695883 A CN 201510695883A CN 105354261 A CN105354261 A CN 105354261A
Authority
CN
China
Prior art keywords
motivation
digital resource
vector
user
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510695883.7A
Other languages
English (en)
Inventor
叶斌
李小磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201510695883.7A priority Critical patent/CN105354261A/zh
Publication of CN105354261A publication Critical patent/CN105354261A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

发明提供一种资源推荐方法和装置,该方案包括设置一个或多个动机标签;然后,为第一数字资源标注所述动机标签,获得每篇数字资源的动机向量;之后,根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量;根据用户浏览的数字资源的动机向量确定用户动机向量,所述部分或全部数字资源属于所述第一数字资源或第二数字资源;最后,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。该方案中,通过将使用动机标签化,能够为未经标注的资源推荐动机标签,并且通过用户行为分析不断的优化推荐策略,使其对资源的动向描述更加准确,从而达到优化资源推荐的目的。

Description

一种数字资源推荐方法及装置
技术领域
本发明涉及信息推荐领域,具体涉及一种数字资源推荐方法及装置。
背景技术
随着移动互联网服务的不断普及和深入,互联网和人们的生活越来越密不可分,而人们对互联网的参与度也变得越来越高,随着自媒体的兴起,人们已经可以轻而易举地作为信息的生产者加入到网络活动中去了。如今信息资源不再贫乏,反而以一种爆炸性的姿态,不断飞速膨胀着,而如何快速的检索到需要的资源成了摆在用户面前的一大难题。
一般的搜索引擎虽然能够满足日常使用,但是在专业资源搜索方面就显得力不从心了,而专业数据库虽然能做到精确的搜索,但是要想搜的准,用户需要使用复杂的高级检索语句,这给用户带来的学习代价是无疑是巨大的。
用户需要一种高效的资源推荐系统来提高检索效率。现在资源推荐有两种主要的方法:基于用户行为分析和基于资源相似度。但这两种方法都有各自的缺陷:首先,用户行为分析的效果具有滞后性。“通过分析用户过去干了什么来预测用户未来可能会干什么”这样的逻辑明显缺乏说服力。也有通过大数据分析得到类似“多数浏览过该资源的用户还喜欢另一个资源”这样的推荐方法,这种方法在一定程度上弥补了前者的缺陷,但是在用户没有访问任何资源时该策略就不起作用了,而且容易产生马太效应即被推荐的资源利用率远高于一般资源,从而使得被推荐的资源长期占据推荐列表,这样资源总体的利用率会很低。而资源相似度计算也同样有明显的缺陷,资源推荐不够个性化,推荐算法优化困难,准确度也不尽如人意。资源本身也在不断的精细化,这使得用户对推荐结果可用性的要求进一步提高,而传统的资源推荐技术已经无法满足当前用户增长的需求。
在现有技术中也公开了一种基于用户动机倾向性的标签推荐方法,该方案中根据用户三元组,计算用户的动机倾向性、每个已标注资源的动机倾向性的待标注资源的动机倾向性,在已标注资源中选择与待标注资源的动机倾向性相似的资源,得到非用户以来相似资源,在非用户以来相似资源中选择与用户的动机倾向性相似的资源,得到标签推荐候选资源;在非用户依赖相似资源中选择与用户的动机倾向性相似的资源,得到标签推荐候选资源,将标签推荐候选资源中的所有标签合并,得到合并标签集;计算合并标签集中每个标签的推荐重要性,最后按照每个标签的推荐重要性从大到小,进行标签推荐。但是,该方案中所描述的用户动机倾向是根据用户三元组计算得到的一套抽象的数值,没有具体的动机倾向信息,如:具体标签名称,在这种情况下,可能导致不同用户在标签的使用上差异很大,但是动机倾向相似的情况,从而使得推荐的结果准确性降低。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中的资源推荐方法资源总体利用率低、针对性差的缺陷,从而提供一种资源推荐方法及装置。
本发明提供一种数字资源推荐方法,包括如下步骤:
设置一个或多个动机标签;
为第一数字资源标注所述动机标签,获得每篇数字资源的动机向量;
根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量;
根据用户浏览的数字资源的动机向量确定用户动机向量,所述部分或全部数字资源属于所述第一数字资源或第二数字资源;
根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
优选地,根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量的步骤包括:
从所述第一数字资源的动机标签中选择一个或多个动机标签作为推荐策略;
计算该推荐策略和所述第二数字资源的文本相似度;
将所述推荐策略和多数文本相似度的乘积作为该推荐策略对应的动机向量。
优选地,根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量的步骤还包括:
计算所有推荐策略对应的动机向量;
将不同推荐策略下的动机向量对应累加后取均值,作为最终的第二数字资源的动机向量。
优选地,根据用户浏览的数字资源的动机向量确定用户动机向量的过程,包括
获取用户浏览的数字资源的动机向量;
将所述用户浏览的数字资源的动机向量累加,作为用户动机向量。
优选地,根据用户浏览的数字资源的动机向量确定用户动机向量的过程,包括
用户每增加浏览一件数字资源,获取该数字资源的动机向量,将其增加到用户动机向量中,对用户动机向量进行更新。
优选地,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源的过程,包括
计算用户动机向量和每件数字资源的动机向量的余弦值,
根据所述余弦值的大小向用户推荐数字资源。
优选地,还包括:根据用户的选择确定推荐策略,更新所述第二数字资源的动机向量,重新计算用户动机向量,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
本发明提供一种数字资源推荐装置,包括如下步骤:
动机标签设置单元,设置一个或多个动机标签;
预标注单元,为第一数字资源标注所述动机标签,获得每篇数字资源的动机向量;
标注单元,根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量;
用户动机向量计算单元,根据用户浏览的数字资源的动机向量确定用户动机向量,所述部分或全部数字资源属于所述第一数字资源或第二数字资源;
推荐单元,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
优选地,标注单元包括:
策略选择单元,从所述第一数字资源的动机标签中选择一个或多个动机标签作为推荐策略;
相似度计算单元,计算该推荐策略和所述第二数字资源的文本相似度;
标注子单元,将所述推荐策略和多数文本相似度的乘积作为该推荐策略对应的动机向量。
优选地,推荐单元包括:
余弦值计算单元,计算用户动机向量和每件数字资源的动机向量的余弦值,
推荐子单元,根据所述余弦值的大小向用户推荐数字资源。
本发明技术方案,具有如下优点:
1.本发明提供一种资源推荐方法,通过先标注动机标签和动机向量,再用标注的动机标签和动机向量对其余的数字资源进行标注,这样,所有的数字资源都采用了相同的标签标注方式,保证了统一性,然后通过比较用户浏览的数字资源的动机向量和每件数字资源的动机向量,为用户进行数字资源的推荐,通过用户行为能够不断的优化推荐策略,使其推荐的准确度更高。
2.本发明提供一种资源推荐方法,根据标定的数字资源为其余为标定的数字资源进行动机标签的推荐和动机向量的计算,此处可以根据多种选择的推荐策略为未标定的数字资源推荐标签,使其标定更加客观、准确且标准一致,为后续推荐提供基础。
3.本发明提供一种资源推荐方法,为用户推荐时,根据用户的浏览记录不断的更新用户动机向量,因此可以随用户的选择而不断的获取用户的最新动向,为用户推荐更加有价值、有针对性的数字资源。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中数字资源推荐方法的一个具体示例的流程图;
图2为本发明实施例2中数字资源推荐方法的一个具体示例的原理框图;
图3为本发明实施例3中数字资源推荐装置的一个具体示例的结构框图;
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本实施例提供一种数字资源推荐方法,用于在用户浏览网页、文献等数字信息时,向用户推荐其更关注的信息,使得推荐的信息更具有针对性,提供用户浏览浏览数字资源的效率。
本实施例中的数字资源推荐方法,流程图如图1所示,包括以下步骤:
S1、设置一个或多个动机标签。
每个动机标签从一个角度表示该数字资源所体现的动机倾向,这些动机标签构成一个动机标签组,用于标识数字资源的动机倾向。如针对动机标签组“出国留学”,其包含的动机标签可以是“考试,托福,雅思,GMAT,GRE”。每件数字资源中又可以包含多个动机标签组,每个标签组内包含若干个动机标签。
S2、为第一数字资源标注所述动机标签,获得每篇数字资源的动机向量。
动机标签组构成了一个向量空间,由动机标签及其权重构成的向量称为“动机向量”,用于表示动机倾向,每件数字资源的每个动机标签的权重根据相关程度来确定。如为数字资源A标定的动机向量为[0.5考试,0.5托福,0.5雅思,0.5GMAT,0.5GRE]。
S3、根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量。第一数字资源为已经标注的数字资源,所述第二数字资源时待标注的数字资源
在通过步骤S2标定了一部分数字资源后,其余的数字资源可以根据标定的数字资源来自动生成推荐的动机向量。
第一步,从所述第一数字资源的动机标签中选择一个或多个动机标签作为推荐策略。
第二步,计算该推荐策略和所述第二数字资源的文本相似度;
第三步,将所述推荐策略和多数文本相似度的乘积作为该推荐策略对应的动机向量。
具体地,用向量空间模型(VSM)计算出推荐策略和未标注资源的文本相似度,把文本相似度和推荐策略的动机向量的乘积作为推荐标签,推荐给待标注资源,例如:
在动机标签组T1([t1,t2,t3,…,tn])时,使用推荐策略A1([t1,t2,t3])和B1(待标注资源),通过VSM计算出相似度为0.5,则为B1推荐标签R1[0.5t1,0.5t2,0.5t3]。
若相似度小于0.1,则视为无效,丢弃结果。
由于可以设置不同的推荐策略,根据可以上述方式计算所有推荐策略对应的动机向量。
将不同推荐策略下的动机向量对应累加后取均值,作为最终的第二数字资源的动机向量。
公式如下:
R=(R1+R2+…+Rn)/n,其中R1、R2、…、Rn为计算出的动机向量,R为该数字资源的动机向量。
例如:
若同样在T1中,除了A1还匹配了A2。A2([t2,t4,t5])和B1的相似度为0.4,则为B1推荐标签R2[0.4t2,0.4t4,0.4t5]。则B1的最终推荐结果等于:
R=(R1+R2)/2
结果为[0.25t1,0.45t2,0.25t3,0.2t4,0.2t5]。
针对每个动机标签组分别计算,而不同动机标签组的计算结果相互隔离,若使用不同动机标签组推荐标签时,不同推荐策略中即使有同名标签也不合并。
针对所有标注的数字资源对上述未标注数字资源进行上述推荐,将一个动机标签组可以看做一种动机类型,其动机向量P,等于该动机标签组下所有推荐策略下的动机向量的均值,即:
P=(P1+P2+…+Pn)/n
S4、根据用户浏览的数字资源的动机向量确定用户动机向量,所述部分或全部数字资源属于所述第一数字资源或第二数字资源。
首先,获取用户浏览的数字资源的动机向量;
然后,将所述用户浏览的数字资源的动机向量累加,作为用户动机向量。
其中,用户每增加浏览一件数字资源,获取该数字资源的动机向量,将其增加到用户动机向量中,对用户动机向量进行更新。
具体方式为:该方案中,为用户进行推荐之前,用户需要先选择动机类型,使用过程中,需要收集用户使用轨迹中的动机向量,形成用户动机向量Q和访问资源次数N,用户动机向量Q的初始值等于所选动机类型T的动机向量P,即Q=P,而N的初始值为0,即N=0,且每一次检索操作都会重置这两个值。当用户点击一篇资源,该资源的动机向量R1就会加入到用户动机向量Q中,同时N自增1,即Q=Q+R1,N=N+1;
S5、根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。具体方法为:计算用户动机向量和每件数字资源的动机向量的余弦值,根据所述余弦值的大小向用户推荐数字资源。
本实施例中采用通过计算用户动机向量Q和所有资源的动机向量R的余弦值L,按L递减排序,推荐资源。
在其他的实施方案中,还可以选择余弦值将大于一定预设阈值的数字资源推荐给用户。
本实施例中的数字资源推荐方案,与传统技术相比,本方法结合了大数据分析和文本相似度计算的优点:该方法本质上是对大数据分析的优化,但不盲目的推荐,而是聚焦于用户的使用动机,通过分析用户操作来确认资源的动机倾向。这种方法要求资源本身有自己的动机倾向,否则就无法被推荐,但是人工标注成本又过高,而文本相似度计算则解决了这个问题:如果两个资源是相似的,那么其使倾向也是相似的。利用这个理论,为未标注的资源推荐标签。在实际应用中,文本相似度计算是有误差的,但是在该方法中使用多个推荐策略为同一个资源推荐标签,这样正确标签的权重就会提高,错误标签的权重就会降低,从算法上修正了误差。但是推荐策略的匮乏将导致这个误差依然很大,该方法考虑到了这个问题,在实际应用中,通过系统分析用户的行为,给资源提供大量备选动机向量(描述用户使用倾向),从而生产出一批新的推荐策略,达到优化目的。
在其他进一步的实施方案中,还包括根据用户的选择确定推荐策略,更新所述第二数字资源的动机向量,重新计算用户动机向量,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。此过程中,根据用户的选择进一步更新对未标定的数字资源进行标签推荐和计算动机向量,如果当用户下载某个资源时,视为“确认”操作,表示用户视该资源为当前动机下的典型资源,并通过计算当前动机向量Q1和点击次数N1得到该资源的备选动机向量O1:
O1=Q1/N1
当多个用户下载同一资源时,该资源就会存储多个备选动机向量[Q1,Q2,…,Qn];
然后,将有备选动机向量的资源作为新的推荐策略,其标签A为备选标签累加后的均值,即:
A=(O1+O2+…+On)/n
然后从步骤S3重新执行。
实施例2
本实施例提供一种基于用户使用动机的资源推荐方法,流程如图2所示,过程如下:
S11、设置若干个动机标签组,每个标签组内包含若干个动机标签,例如:动机标签组“出国留学”包含动机标签[考试,托福,雅思,GMAT,GRE,SAT]。动机标签组构成一个向量空间,由动机标签及其权重构成的向量称为“动机向量”,用于表示动机倾向,例如:
[0.5考试,0.5托福,0.5雅思,0.5GMAT,0.5GRE,0.5SAT]
S12、为一部分典型资源标注动机标签,并把同一个动机标签组下的已标注的资源作为“推荐策略”;
S13、通过计算推荐策略和未标注资源的文本相似度为未标注资源推荐动机标签,具体步骤如下:
用向量空间模型(VSM)计算出推荐策略和未标注资源的文本相似度,把文本相似度和推荐策略的动机向量的乘积作为推荐标签,推荐给待标注资源,例如:
在动机标签组T1([t1,t2,t3,…,tn])时,使用推荐策略A1([t1,t2,t3])和B1(待标注资源),通过VSM计算出相似度为0.5,则为B1推荐标签R1[0.5t1,0.5t2,0.5t3]。
若相似度小于0.1,则视为无效,丢弃结果。
同一动机标签组下的不同推荐策略的推荐结果累加后取均值,公式为:
R=(R1+R2+…+Rn)/n
例如:
若同样在T1中,除了A1还匹配了A2。A2([t2,t4,t5])和B1的相似度为0.4,则为B1推荐标签R2[0.4t2,0.4t4,0.4t5]。则B1的最终推荐结果等于:R=(R1+R2)/2
结果为[0.25t1,0.45t2,0.25t3,0.2t4,0.2t5]。
而不同动机标签组的计算结果相互隔离,若使用不同动机标签组推荐标签时,不同推荐策略中即使有同名标签也不合并。
S14、取推荐策略的动机向量的均值作为该动机标签组的动机向量P,计算公式:
P=(P1+P2+…+Pn)/n
动机标签组在系统中表示为“动机类型”;
S15、用户使用系统时,首先会选择动机类型,在使用过程中系统会不断的收集用户的使用轨迹中的动机向量,并据此推荐资源,具体步骤如下:
用户进入系统时,系统会要求用户选择动机类型T。
使用过程中,系统会收集用户使用轨迹中的动机向量,形成用户动机向量Q和访问资源次数N;
用户动机向量Q的初始值等于所选动机类型T的动机向量P,即Q=P,而N的初始值为0,即N=0,且每一次检索操作都会重置这两个值;
当用户点击一篇资源,该资源的动机向量R1就会加入到用户动机向量Q中,同时N自增1,即Q=Q+R1,N=N+1;
系统通过计算用户动机向量Q和所有资源的动机向量R的余弦值L,按L递减排序,推荐资源。
S16、分析用户行为,用户的特定操作将被视为对推荐结果的“确认”,系统根据确认操作生成新的推荐策略,从而优化下一次的标签推荐的结果,具体步骤如下:
当用户下载某个资源时,视为“确认”操作,表示用户视该资源为当前动机下的典型资源,并通过计算当前动机向量Q1和点击次数N1得到该资源的备选动机向量O1:
O1=Q1/N1
当多个用户下载同一资源时,该资源就会存储多个备选动机向量[Q1,Q2,…,Qn];
将有备选动机向量的资源作为新的推荐策略,其标签A为备选标签累加后的均值,即:
A=(O1+O2+…+On)/n
之后,从步骤(3)重新开始。
通过备选的推荐策略,为未标注的数字资源重新进行动机标签和动机向量的标定,使其根据用户的选择进行了更新。
本实施例中的基于用户使用动机的资源推荐方法,包括:设置若干个动机标签组,每个标签组内包含若干个动机标签,动机标签组构成一个向量空间,由动机标签及其权重构成的向量称为“动机向量”,用于表示动机倾向;为一部分典型资源标注动机标签,并把同一个动机标签组下的已标注的资源作为“推荐策略”;通过计算推荐策略和未标注资源的文本相似度为未标注资源推荐动机标签;取推荐策略的动机向量的均值作为该动机标签组的动机向量,动机标签组在系统中表示为“动机类型”;用户使用系统时,首先会选择动机类型,在使用过程中系统会不断的收集用户的使用轨迹中的动机向量,并据此推荐资源;用户的特定操作将被视为对推荐结果的“确认”;系统根据确认操作生成新的推荐策略,从而优化下一次的标签推荐的结果。本发明通过将用户的使用动机标签化,能够为未经标注的资源推荐动机标签,并且通过用户行为分析不断的优化推荐策略,使其对资源的动向描述更加准确,从而达到优化资源推荐的目的。
实施例3
本实施例提供一种数字资源推荐装置,结构框图如图3所示,包括:
动机标签设置单元01,设置一个或多个动机标签;
预标注单元02,为第一数字资源标注所述动机标签,获得每篇数字资源的动机向量;
标注单元03,根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量;
用户动机向量计算单元04,根据用户浏览的数字资源的动机向量确定用户动机向量,所述部分或全部数字资源属于所述第一数字资源或第二数字资源;
推荐单元05,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
其中,标注单元包括:
策略选择单元,从所述第一数字资源的动机标签中选择一个或多个动机标签作为推荐策略;
相似度计算单元,计算该推荐策略和所述第二数字资源的文本相似度;
标注子单元,将所述推荐策略和多数文本相似度的乘积作为该推荐策略对应的动机向量。
标注单元还包括:
循环计算单元,计算所有推荐策略对应的动机向量;
最终动机向量计算单元,将不同推荐策略下的动机向量对应累加后取均值,作为最终的第二数字资源的动机向量。
其中,用户动机向量计算单元包括,
用户信息获取子单元,获取用户浏览的数字资源的动机向量;
累积子单元,将所述用户浏览的数字资源的动机向量累加,作为用户动机向量。用户每增加浏览一件数字资源,获取该数字资源的动机向量,将其增加到用户动机向量中,对用户动机向量进行更新。
其中,推荐单元包括:
余弦值计算单元,计算用户动机向量和每件数字资源的动机向量的余弦值,
推荐子单元,根据所述余弦值的大小向用户推荐数字资源。
此外,还包括更新单元,根据用户的选择确定推荐策略,更新所述第二数字资源的动机向量,重新计算用户动机向量,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种数字资源推荐方法,其特征在于,包括如下步骤:
设置一个或多个动机标签;
为第一数字资源标注所述动机标签,获得每篇数字资源的动机向量;
根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量;
根据用户浏览的数字资源的动机向量确定用户动机向量,所述部分或全部数字资源属于所述第一数字资源或第二数字资源;
根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
2.根据权利要求1所述的方法,其特征在于:根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量的步骤包括:
从所述第一数字资源的动机标签中选择一个或多个动机标签作为推荐策略;
计算该推荐策略和所述第二数字资源的文本相似度;
将所述推荐策略和多数文本相似度的乘积作为该推荐策略对应的动机向量。
3.根据权利要求2所述的方法,其特征在于,根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量的步骤还包括:
计算所有推荐策略对应的动机向量;
将不同推荐策略下的动机向量对应累加后取均值,作为最终的第二数字资源的动机向量。
4.根据权利要求3所述的方法,其特征在于,根据用户浏览的数字资源的动机向量确定用户动机向量的过程,包括
获取用户浏览的数字资源的动机向量;
将所述用户浏览的数字资源的动机向量累加,作为用户动机向量。
5.根据权利要求4所述的方法,其特征在于,根据用户浏览的数字资源的动机向量确定用户动机向量的过程,包括
用户每增加浏览一件数字资源,获取该数字资源的动机向量,将其增加到用户动机向量中,对用户动机向量进行更新。
6.根据权利要求5任一项所述的方法,其特征在于,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源的过程,包括
计算用户动机向量和每件数字资源的动机向量的余弦值,
根据所述余弦值的大小向用户推荐数字资源。
7.根据权利要求6任一项所述的方法,其特征在于,还包括:根据用户的选择确定推荐策略,更新所述第二数字资源的动机向量,重新计算用户动机向量,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
8.一种数字资源推荐装置,其特征在于,包括如下步骤:
动机标签设置单元,设置一个或多个动机标签;
预标注单元,为第一数字资源标注所述动机标签,获得每篇数字资源的动机向量;
标注单元,根据所述第一数字资源及其动机向量为第二数字资源推荐动机标签,确定所述第二数字资源的动机向量;
用户动机向量计算单元,根据用户浏览的数字资源的动机向量确定用户动机向量,所述部分或全部数字资源属于所述第一数字资源或第二数字资源;
推荐单元,根据每件数字资源的动机向量和所述用户动机向量推荐数字资源。
9.根据权利要求8所述的装置,其特征在于:标注单元包括:
策略选择单元,从所述第一数字资源的动机标签中选择一个或多个动机标签作为推荐策略;
相似度计算单元,计算该推荐策略和所述第二数字资源的文本相似度;
标注子单元,将所述推荐策略和多数文本相似度的乘积作为该推荐策略对应的动机向量。
10.根据权利要求8或9所述的装置,其特征在于,推荐单元包括:
余弦值计算单元,计算用户动机向量和每件数字资源的动机向量的余弦值,
推荐子单元,根据所述余弦值的大小向用户推荐数字资源。
CN201510695883.7A 2015-10-23 2015-10-23 一种数字资源推荐方法及装置 Pending CN105354261A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510695883.7A CN105354261A (zh) 2015-10-23 2015-10-23 一种数字资源推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510695883.7A CN105354261A (zh) 2015-10-23 2015-10-23 一种数字资源推荐方法及装置

Publications (1)

Publication Number Publication Date
CN105354261A true CN105354261A (zh) 2016-02-24

Family

ID=55330234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510695883.7A Pending CN105354261A (zh) 2015-10-23 2015-10-23 一种数字资源推荐方法及装置

Country Status (1)

Country Link
CN (1) CN105354261A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407420A (zh) * 2016-09-23 2017-02-15 广州视源电子科技股份有限公司 一种多媒体资源的推荐方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156721A (zh) * 2011-03-29 2011-08-17 张栋 基于标签的互联网视频广告精准投放方法
US20120226651A1 (en) * 2011-03-03 2012-09-06 Xerox Corporation System and method for recommending items in multi-relational environments
CN103049479A (zh) * 2012-11-26 2013-04-17 北京奇虎科技有限公司 一种在线视频标签生成方法和系统
CN103136275A (zh) * 2011-12-02 2013-06-05 盛乐信息技术(上海)有限公司 个性化视频推荐系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120226651A1 (en) * 2011-03-03 2012-09-06 Xerox Corporation System and method for recommending items in multi-relational environments
CN102156721A (zh) * 2011-03-29 2011-08-17 张栋 基于标签的互联网视频广告精准投放方法
CN103136275A (zh) * 2011-12-02 2013-06-05 盛乐信息技术(上海)有限公司 个性化视频推荐系统及方法
CN103049479A (zh) * 2012-11-26 2013-04-17 北京奇虎科技有限公司 一种在线视频标签生成方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407420A (zh) * 2016-09-23 2017-02-15 广州视源电子科技股份有限公司 一种多媒体资源的推荐方法及系统
CN106407420B (zh) * 2016-09-23 2020-04-21 广州视源电子科技股份有限公司 一种多媒体资源的推荐方法及系统

Similar Documents

Publication Publication Date Title
Reddy et al. Content-based movie recommendation system using genre correlation
US20220382564A1 (en) Aggregate features for machine learning
Tong et al. A linear road object matching method for conflation based on optimization and logistic regression
JP5855773B2 (ja) 売り主に関係付けられた信頼レベルの値に基づくサーチ結果順位の決定
US20140025533A1 (en) Method and Apparatus of Recommending Clothing Products
CN111262953B (zh) 一种实时推送信息的方法和装置
US20120330962A1 (en) Method and Apparatus of Providing Suggested Terms
CN103544623A (zh) 一种基于用户偏好特征建模的Web 服务推荐方法
EP2619718A1 (en) Processing of categorized product information cross reference to other applications
Gao et al. SeCo-LDA: Mining service co-occurrence topics for recommendation
CN102184199A (zh) 网络信息推荐方法及系统
CN103020049A (zh) 搜索方法及搜索系统
US20120150753A1 (en) Quantitative valuation of real estate based on qualitative assessment thereof
Sattari et al. Geo-activity recommendations by using improved feature combination
CN106126544A (zh) 一种互联网内容的投放方法及装置
CN104036035A (zh) 一种历史搜索建议提示方法及装置
CN104636401A (zh) 一种scada系统数据回滚的方法及装置
CN111797312A (zh) 模型训练的方法及装置
US11023465B2 (en) Cross-asset data modeling in multi-asset databases
US9916348B1 (en) Answer facts from structured content
CN114331602A (zh) 一种基于迁移学习的模型训练方法、信息推荐方法及装置
CN105354261A (zh) 一种数字资源推荐方法及装置
CN103294791A (zh) 一种可扩展标记语言模式匹配方法
CN113298485A (zh) 门店数据的生成方法、装置及电子设备
Zheng et al. A machine learning-based tourist path prediction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160224