CN105787055B - 信息推荐方法及装置 - Google Patents
信息推荐方法及装置 Download PDFInfo
- Publication number
- CN105787055B CN105787055B CN201610110002.5A CN201610110002A CN105787055B CN 105787055 B CN105787055 B CN 105787055B CN 201610110002 A CN201610110002 A CN 201610110002A CN 105787055 B CN105787055 B CN 105787055B
- Authority
- CN
- China
- Prior art keywords
- feature
- weight
- processed
- user
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Abstract
本发明提供了一种信息推荐方法及装置,其中,该信息推荐方法包括以下步骤:根据预定时间段内用户所请求的各第一对象的特征集合以及请求时间,来确定所述用户当前感兴趣的第二对象的特征集合;分别确定所述第二对象的特征集合与初始推荐信息中的各第三对象的特征集合的共同特征,并根据各共同特征分别计算相应的所述第三对象与所述第二对象的相似度;根据所计算出的各相似度来分别调整相应的所述第三对象的对象权重;以及根据调整后的各所述第三对象的对象权重对所述初始推荐信息重新进行对象排序,并根据排序结果重新向所述用户推荐信息。通过本发明实施例提供的信息推荐方法及装置,能够给用户推荐符合用户当前关注点的内容,提高了用户体验。
Description
技术领域
本发明涉及信息推荐技术领域,尤其涉及信息推荐方法及装置。
背景技术
当前网站的推荐系统,通常使用用户过去的行为产生的服务日志作为数据集,基于数据挖掘和机器学习的计算处理后为用户或商品生成特定的商品推荐列表、即信息推荐列表。当用户发起服务请求时,推荐系统直接根据用户或其正在浏览的商品信息读取推荐列表并展示给用户。
然而,由于上述推荐方法忽略了最有价值的用户近期请求及其反映出的用户当前关注点(兴趣点),从而无法对用户当前的行为和兴趣转移做出及时的反馈和差异化的显示,因此无法给用户推荐符合用户当前关注点的内容,用户体验性较差。
发明内容
技术问题
有鉴于此,本发明要解决的技术问题是如何给用户推荐符合用户当前关注点的内容。
解决方案
为了解决上述技术问题,根据本发明的一实施例,提供了一种信息推荐方法,包括:根据预定时间段内用户所请求的各第一对象的特征集合以及请求时间,来确定所述用户当前感兴趣的第二对象的特征集合;分别确定所述第二对象的特征集合与初始推荐信息中的各第三对象的特征集合的共同特征,并根据各共同特征分别计算相应的所述第三对象与所述第二对象的相似度;根据所计算出的各相似度来分别调整相应的所述第三对象的对象权重;以及根据调整后的各所述第三对象的对象权重对所述初始推荐信息重新进行对象排序,并根据排序结果重新向所述用户推荐信息。
对于上述信息推荐方法,在一种可能的实现方式中,所述第一对象的特征集合包括所述用户所请求的第一对象的特征及其对应的特征权重,所述第二对象的特征集合包括所述用户当前感兴趣的第二对象的特征及其对应的特征权重,
根据预定时间段内用户所请求的各第一对象的特征集合以及请求时间,来确定所述用户当前感兴趣的第二对象的特征集合,包括:根据所述预定时间段内所有所述第一对象的特征集合,整合得到各待处理特征;根据所述待处理特征所在的各第一对象中的特征权重以及请求时间,来调整所述待处理特征的特征权重;以及在所述待处理特征的调整后的特征权重大于特征权重阈值的情况下,将所述待处理特征及其调整后的特征权重加入所述第二对象的特征集合。
对于上述信息推荐方法,在一种可能的实现方式中,根据所述待处理特征所在的各第一对象中的特征权重以及请求时间,来调整所述待处理特征的特征权重,包括:
根据以下公式1,来调整所述待处理特征的特征权重,
其中,tl表示所述待处理特征,n表示所有所述第一对象中存在待处理对象特征tl的第一对象的个数,ptlk表示待处理对象特征tl所在的各第一对象中待处理对象特征tl的特征权重,tilk表示待处理对象特征tl所在的各第一对象的请求时间,pl表示调整后的待处理对象特征tl的特征权重,1≤k≤n,th表示当前时间,β表示比例调整参数。
对于上述信息推荐方法,在一种可能的实现方式中,根据各共同特征分别计算相应的所述第三对象与所述第二对象的相似度,包括:
根据以下公式2,来计算相应的所述第三对象与所述第二对象的相似度,
其中,L表示所述第三对象与所述第二对象的相似度,m表示所述第三对象的特征集合与所述第二对象的特征集合的共同特征的个数,pj表示m个共同特征中的特征tj在所述第二对象的特征集合中的特征权重,pj'表示特征tj在所述第三对象中的特征集合中的特征权重。
对于上述信息推荐方法,在一种可能的实现方式中,根据所计算出的各相似度来分别调整相应的所述第三对象的对象权重,包括:
根据以下公式3,来调整相应的所述第三对象的对象权重,
v'=v+θL 公式3
其中,v表示所述初始推荐信息中的第三对象的对象权重,v'表示对所述第三对象的对象权重进行调整后的对象权重,θ表示比例调整参数。
为了解决上述技术问题,根据本发明的一实施例,提供了一种信息推荐装置,包括:确定单元,用于根据预定时间段内用户所请求的各第一对象的特征集合以及请求时间,来确定所述用户当前感兴趣的第二对象的特征集合;计算单元,与所述确定单元相连接,用于分别确定所述第二对象的特征集合与初始推荐信息中的各第三对象的特征集合的共同特征,并根据各共同特征分别计算相应的所述第三对象与所述第二对象的相似度;调整单元,与所述计算单元相连接,用于根据所计算出的各相似度来分别调整相应的所述第三对象的对象权重;以及排序单元,与所述调整单元相连接,用于根据调整后的各所述第三对象的对象权重对所述初始推荐信息重新进行对象排序,并根据排序结果重新向所述用户推荐信息。
对于上述信息推荐装置,在一种可能的实现方式中,所述第一对象的特征集合包括所述用户所请求的第一对象的特征及其对应的特征权重,所述第二对象的特征集合包括所述用户当前感兴趣的第二对象的特征及其对应的特征权重,
所述确定单元包括:整合模块,用于根据所述预定时间段内所有所述第一对象的特征集合,整合得到各待处理特征;调整模块,与所述整合模块相连接,用于根据所述待处理特征所在的各第一对象中的特征权重以及请求时间,来调整所述待处理特征的特征权重;以及加入模块,与所述调整模块相连接,用于在所述待处理特征的调整后的特征权重大于特征权重阈值的情况下,将所述待处理特征及其调整后的特征权重加入所述第二对象的特征集合。
对于上述信息推荐装置,在一种可能的实现方式中,所述调整模块用于:
根据以下公式1,来调整所述待处理特征的特征权重,
其中,tl表示所述待处理特征,n表示所有所述第一对象中存在待处理对象特征tl的第一对象的个数,ptlk表示待处理对象特征tl所在的各第一对象中待处理对象特征tl的特征权重,tilk表示待处理对象特征tl所在的各第一对象的请求时间,pl表示调整后的待处理对象特征tl的特征权重,1≤k≤n,th表示当前时间,β表示比例调整参数。
对于上述信息推荐装置,在一种可能的实现方式中,所述计算单元用于:
根据以下公式2,来计算相应的所述第三对象与所述第二对象的相似度,
其中,L表示所述第三对象与所述第二对象的相似度,m表示所述第三对象的特征集合与所述第二对象的特征集合的共同特征的个数,pj表示m个共同特征中的特征tj在所述第二对象的特征集合中的特征权重,pj'表示特征tj在所述第三对象中的特征集合中的特征权重。
对于上述信息推荐装置,在一种可能的实现方式中,所述调整单元用于:
根据以下公式3,来调整相应的所述第三对象的对象权重,
v'=v+θL 公式3
其中,v表示所述初始推荐信息中的第三对象的对象权重,v'表示对所述第三对象的对象权重进行调整后的对象权重,θ表示比例调整参数。
有益效果
通过本发明实施例的信息推荐方法及装置,能够基于用户近期的服务请求序列来确定用户当前感兴趣的特征点(兴趣点),并根据所确定的用户当前感兴趣的特征点来从推荐信息列表的众多信息中筛选出包含或贴近用户当前兴趣点的信息,并将这部分信息优先推荐给用户并在合适的位置展示,使最终推荐的内容既符合用户过往行为,又贴近用户当前兴趣点,从而保障了用户体验的一致性,提高了推荐服务的覆盖率、多样性、新颖性。通过本发明实施例的信息推荐方法及装置,能够给用户推荐符合用户当前关注点的内容,提高了用户体验。
根据下面参考附图对示例性实施例的详细说明,本发明的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面,并且用于解释本发明的原理。
图1示出根据本发明一实施例的信息推荐方法的流程图;
图2示出根据本发明另一实施例的信息推荐方法的流程图;
图3示出根据本发明一实施例的信息推荐方法的具体应用示例图;
图4示出本发明一实施例的筛选器的工作流程图;
图5示出根据本发明一实施例的信息推荐装置的结构框图。
具体实施方式
以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。
如背景技术中所述,在当前网站的推荐系统中,在接收到用户的服务请求时,会根据用户过往行为数据来在线计算出推荐信息列表而推荐给用户,或依据用户、标签、或对象等的ID直接读取存储的利用常用的离线推荐算法所计算出的推荐信息列表并推荐给用户。
在现有技术中,例如可以通过采用一个二元组r=(Id,I)描述(初始)推荐信息列表。其中,r表示基于某一特定标识Id推荐给用户的对象列表,该对象可以是商品或物品,也可以为视频、电子文档、音乐等。该特定标识Id为不重复的唯一值,可以是用户id、标签id、对象id等。其中,I为推荐对象列表,可以表示为I={i1,v1,i2,v2,...,in,vn},即表示基于该特定标识Id的n个推荐对象。其中,ik为第k个对象的唯一标识id,vk是第k个物品与该特定标识Id所标识的对象的相似度,即权重,其中,k=1,2,……,n。在推荐对象列表I中,各个对象ik按照其权重vk从大到小排序而推荐给用户。在一种可能的实现方式中,该推荐信息列表可以使用例如聚类算法,协同过滤算法等多种公知的算法来生成。
此外,对于某一对象而言,其可以有多种具体的表现形式,即一个对象可以具有多个特征。例如,对象的特征可以为标题或内容中的关键词,也可以为对象的标签,还可以为某些对象发布者(例如知名的自制视频者)、与该对象发生频繁行为关联的用户群体的类别等。其中关键词提取及权重计算可采用用于信息检索与数据挖掘的常用加权技术tf-idf(term frequency–inverse document frequency)以及Lucene(全文搜索引擎)分词技术等。
例如,可以通过采用一个二元组o=(i,T)来描述对象的特征。其中,o表示对象及其相应的(对象)特征。i表示对象的标识id,即如上所述,i可以为i1,i2,……in。T表示对象的特征集合或列表,可以用T={t1,p1,t2,p2,...,tm,pm}来表示。其中,m表示该对象所具有的特征的个数,th是该对象的第h个特征的标识,ph是第h个特征的权重。
需要说明的是,不同的对象所具有的特征的种类和个数可能不同,并且即使两个对象所具有的特征的种类和个数均相同,如果其中某一特征对应的特征权重不同,则这两个对象也是不同的。并且,对象的特征权重值与推荐列表中对象的权重值应处于同一取值范围及基准,便于后期的优化计算。
在现有技术的推荐系统中,根据用户过往行为数据,能够计算出例如上述形式的推荐信息列表,并将计算出的上述信息推荐列表推荐给客户。
然而,现有的推荐方法没有针对用户当前的请求及时对推荐服务做出修正,忽略了用户兴趣的变化,从而不能给用户推荐出其当前最感兴趣的服务内容。并且,对于用户近期所产生的相同浏览请求,推荐服务显示的信息都是固定且相同的、与当前服务最相似的服务,该推荐的服务内容覆盖率、多样性、新颖性较低。因此,现有的推荐技术无法给用户推荐符合用户当前关注点的内容,用户体验性较差。
为此,本发明提供了一种信息推荐方法及装置,能够基于用户近期的服务请求序列来确定用户当前感兴趣的特征点(兴趣点),并根据所确定的用户当前感兴趣的特征点来从推荐信息列表的众多信息中筛选出包含用户当前兴趣点的信息,并将这部分信息优先推荐给用户并在合适的位置展示,使最终推荐的内容既符合用户过往行为,又贴近用户当前兴趣点,从而保障了用户体验的一致性,提高了推荐服务的覆盖率、多样性、新颖性。该信息推荐方法的具体流程及信息推荐装置的具体结构可以参见下述实施例的详细阐述。
实施例1
图1示出根据本发明一实施例的信息推荐方法的流程图。如图1所示,该信息推荐方法主要包括:
步骤S100、根据预定时间段内用户所请求的各第一对象的特征集合以及请求时间,来确定用户当前感兴趣的第二对象的特征集合;
步骤S110、分别确定第二对象的特征集合与初始推荐信息中的各第三对象的特征集合的共同特征,并根据各共同特征分别计算相应的第三对象与第二对象的相似度;
步骤S120、根据所计算出的各相似度来分别调整相应的第三对象的对象权重;以及
步骤S130、根据调整后的各第三对象的对象权重对初始推荐信息重新进行对象排序,并根据排序结果重新向用户推荐信息。
对于上述步骤S100,推荐系统在接收到用户的服务请求后,获取该用户在预定时间段内的服务请求序列,并根据该用户在预定时间段内的服务请求序列来确定该用户当前感兴趣的特征点。该预定时间段内的服务请求序列可以为距离当前时间在例如十分钟内的用户会话中的服务请求序列。
在本发明实施例中,可以采用一个二元组a=(UID,Ti)来描述用户请求序列。其中,UID表示用户的身份标识,Ti={i1,ti1,i2,ti2,...,in,tin}为该用户的请求序列。i为对象的唯一标识。tik表示用户UID对某一对象ik的一次请求(例如购买,浏览,评论等)所发生的时间。换句话说,通过用户请求序列,能够知道该用户近期请求的每一个对象以及请求该每一个对象所发生的时间。其中,在本发明实施例中,用第一对象表示用户近期的请求序列的对象。
在本发明实施例中所涉及的对象可以是商品或物品,也可以为视频、电子文档、音乐等,还可以是其它内容,在本发明实施例中并不进行具体的限定。
在一种可能的实现方式中,可以通过设定阈值来清除与当前时间间隔超过设定阈值的请求序列,从而确定出预定时间段内的请求序列。例如,最大请求有效时间(阈值)为tx,当前时间为ty,当接收到用户请求时,从前至后读取序列中的每一项,若ty-tik-1>=tx,并且ty-tik<tx,则将前k-1项移出序列,从而得到请求序列Ti={ik,tik,ik+1,tik+1,...,in,tin}。在本发明实施例中,不限定阈值的具体取值,本领域技术人员可以根据实际的应用场景灵活设定。
在一种可能的实现方式中,每次用户发起请求时,后台服务器确定出用户在预定时间段内的服务请求序列,并存储在服务器端的会话(session)等中,或者存储在用户浏览器的cookie等中。
在确定用户在预定时间段内所请求的每一个第一对象i后,确定该每一个第一对象i所具有的特征及其权重,即确定每一个第一对象i的特征集合T。然后,根据所确定的第一对象i的特征集合T以及用户相应请求每一个第一对象i的时间,来确定用户当前感兴趣的对象的特征集合。在本发明实施例中,用户当前感兴趣的对象称为第二对象。该第二对象的特征集合包括第二对象的特征及其相应的特征权重。
在一种可能的实现方式中,如图2所示,上述步骤S100可以包括以下步骤:
步骤S1001、根据预定时间段内所有第一对象的特征集合,整合得到各待处理特征;
步骤S1002、根据待处理特征所在的各第一对象中的特征权重以及请求时间,来调整待处理特征的特征权重;以及
步骤S1003、在待处理特征的调整后的特征权重大于特征权重阈值的情况下,将待处理特征及其调整后的特征权重加入第二对象的特征集合。
对于上述步骤S1001,首先,确定在预定时间段内所有第一对象中所存在的特征。例如,用户在预定时间段内请求了5个第一对象i1、i2、i3、i4、i5,而第一对象i1具有5个特征t1、t2、t3、t4、t5,第一对象i2具有3个特征t1、t2、t3,第一对象i3具有3个特t3、t4、t5,第一对象i4具有2个特征t1、t6,第一对象i5具有3个特征t1、t6、t7,则在预定时间段内所有第一对象i1、i2、i3、i4、i5中所存在的特征为7个,即分别为t1、t2、t3、t4、t5、t6、t7。并且,在本发明实施例中,将这些特征称为待处理特征。
对于上述步骤S1002,根据这些待处理特征t1、t2、t3、t4、t5、t6、t7在各第一对象i1、i2、i3、i4、i5中的特征权重、以及请求对象i1、i2、i4、i5的时间ti1、ti2、ti3、ti4、ti5来调整这些待处理特征的特征权重。
例如,如上所述,待处理特征t1存在于第一对象i1、i2、i4、i5中,其对应的特征权重分别为p1i1、p1i2、p1i4、p1i5,则可以根据这4个特征权重、以及请求时间ti1、ti2、ti4、ti5来调整待处理特征t1的特征权重pt1。又如,待处理特征t2存在于第一对象i1、i2中,其对应的特征权重分别为p2i1、p2i2,则可以根据这2个特征权重、以及请求时间ti1、ti2来调整待处理特征t2的特征权重pt2。依此类推,可以依次调整t3、t4、t5、t6、t7的特征权重pt3、pt4、pt5、pt6、pt7。
对于上述步骤S1003,依次将这些待处理特征t1、t2、t3、t4、t5、t6、t7调整后的特征权重p2i1、p2i2、pt3、pt4、pt5、pt6、pt7与预设的特征权重阈值pmin相比较,并将这些调整后的特征权重中大于特征权重阈值pmin的特征权重及其对应的特征加入用户当前感兴趣的兴趣特征集合、即第二对象的特征集合中。例如,只有待处理特征t1、t2、t3、t4、t5的特征权重大于特征权重阈值pmin,则可以确定第二对象的特征集合T={t1,pt1,t2,pt2,t3,pt3,t4、pt4,t5,pt5}。
由此,通过上述步骤S100,可以确定用户当前感兴趣的特征点及其特征权重。
对于上述步骤S110,在确定了用户当前感兴趣的第二对象的特征集合后,将该第二对象的特征集合分别与初始推荐信息列表中的各对象的特征集合进行比较,以确定它们之间共同的特征。在本发明实施例中,将初始推荐信息列表中的对象称为第三对象。
如上所述,初始推荐信息列表是利用现有技术中的推荐技术并根据该用户的过往行为而推荐给用户的。在本实施例中,在接收到用户的服务请求时,可以先执行上述步骤S100,然后再获取初始推荐信息列表,也可以先获取初始推荐信息列表,再执行上述步骤S100,或者还可以使以上两个过程同时进行。
如上所述,例如,当所确定出的第二对象的特征集合T={t1,pt1,t2,pt2,t3,pt3,t4、pt4,t5,pt5}时,如果初始推荐信息列表中某一第三对象的特征集合中存在t1、t2,则可以确定第二对象与该第三对象的共同特征为t1、t2。
然后,可以根据所确定出的第二对象与某一第三对象的共同特征、以及这些共同特征分别在第二对象与该第三对象中的特征权重,来计算第二对象与该第三对象的相似度。同理,可以分别计算出第二对象与初始推荐信息列表中所有的第三对象的相似度。
对于上述步骤S120,在计算出第二对象与初始推荐信息列表中所有的第三对象的相似度后,可以根据所计算出的相似度,来分别调整相应的第三对象的对象权重v。
对于上述步骤S130,根据调整后的第三对象的对象权重v,可以对初始推荐信息列表中的第三对象重新排序,然后将根据排序结果重新向用户推荐信息。例如,可以根据排序结果以及实际展示数目需求按顺序选取部分排序结果推荐给用户。又如,可以将所有的排序结果按顺序推荐给用户。
通过本发明实施例的信息推荐方法,能够基于用户近期的服务请求序列来确定用户当前感兴趣的特征点,并根据所确定的用户当前感兴趣的特征点来从推荐信息列表的众多信息中筛选出包含或贴近用户当前兴趣点的信息,并将这部分信息优先推荐给用户并在合适的位置展示,使最终推荐的内容既符合用户过往行为,又贴近用户当前兴趣点,从而保障了用户体验的一致性,提高了推荐服务的覆盖率、多样性、新颖性。通过本发明实施例的信息推荐方法,能够给用户推荐符合用户当前关注点的内容,提高了用户体验。
实施例2
本实施例与上述实施例1的主要区别在于,在本实施例中,可以具体通过以下公式2来执行上述步骤S1002。
其中,tl表示待处理特征,n表示所有第一对象中存在待处理对象特征tl的第一对象的个数,ptlk表示待处理对象特征tl所在的各第一对象中待处理对象特征tl的特征权重,tilk表示待处理对象特征tl所在的各第一对象的请求时间,pl表示调整后的待处理对象特征tl的特征权重,1≤k≤n,th表示当前时间,β表示比例调整参数,用于将所计算出的特征权重调整至合适的比例。
通过上述公式1,能够根据这些待处理特征在各第一对象中的特征权重、请求各第一对象的时间、当前请求的时间来调整这些待处理特征的特征权重,从而能够得到用户当前感兴趣的特征及其特征权重。
在一种可能的实现方式中,可以利用以下公式2来计算初始推荐列表中的各第三对象与反映用户当前感兴趣的特征及其特征权重的第二对象的相似度,即利用以下公式2来执行上述步骤S110。
其中,L表示初始推荐列表中的某一第三对象与第二对象的相似度,m表示该第三对象的特征集合与第二对象的特征集合的共同特征的个数,pj表示m个共同特征中的特征tj在第二对象的特征集合中的特征权重,pj'表示特征tj在第三对象中的特征集合中的特征权重。
通过上述公式2,能够计算出用户当前感兴趣的对象与初始推荐给用户的各对象的相似度。
在一种可能的实现方式中,根据通过上述公式2所计算出的各相似度,利用以下公式3,可以调整初始推荐信息列表中的各对象的对象权重。
v'=v+θL 公式3
其中,v表示初始推荐信息中的第三对象的对象权重,v'表示对第三对象的对象权重进行调整后的对象权重,θ表示比例调整参数,用于将所计算出的特征权重调整至合适的比例。
具体而言,在利用上述公式2计算出用户当前感兴趣的对象与初始推荐信息列表中的各对象的相似度L后,可以利用公式3,将各对象初始的权重v调整为v'。
这样,在通过公式3计算出的对象权重v'中,能够反映用户当前感兴趣的兴趣点。然后根据计算出的对象权重v',对初始推荐信息列表中的各对象重新进行排序,并根据排序结果重新向用户推荐信息。
通过本发明实施例的信息推荐方法,能够基于用户近期的服务请求序列来确定用户当前感兴趣的特征点,并根据所确定的用户当前感兴趣的特征点来从推荐信息列表的众多信息中筛选出包含或贴近用户当前兴趣点的信息,并将这部分信息优先推荐给用户并在合适的位置展示,使最终推荐的内容既符合用户过往行为,又贴近用户当前兴趣点,从而保障了用户体验的一致性,提高了推荐服务的覆盖率、多样性、新颖性。通过本发明实施例的信息推荐方法,能够给用户推荐符合用户当前关注点的内容,提高了用户体验。
实施例3
图3示出根据本发明一实施例的信息推荐方法的具体应用示例图。在本实施例中,该信息推荐方法可以采用以下6个实体实现:初始推荐信息列表、对象特征信息、用户请求序列(近期)、用户当前兴趣点、筛选器、排序器。其中,给用户的一次信息推荐过程可以对应一个推荐信息列表,一个服务请求序列,一次用户兴趣点的确定,多次对象特征的读取,并运行一次筛选器、一次排序器。具体实现方法如图3所示,其具体过程如下。
1)根据用户过往行为日志中所存储的用户过往行为数据,基于用户当前的服务请求在线计算或读取离线计算出的初始推荐信息列表,作为推荐服务的基础数据。
其中,该初始推荐信息列表例如表示为如上所述的二元组r=(Id,I),其中,Id为用户id、标签id、对象id等,r表示基于Id而推荐给用户的信息列表,I为推荐对象列表,可以表示为I={i1,v1,i2,v2,...,in,vn}。
2)定时、例如每天依据过往服务日志确定对象的包括特征及其权重的对象特征信息,以使得之后能够根据所确定的对象特征信息对所推荐的初始推荐信息列表进行优化。
其中,如上所述,例如可以通过采用一个二元组o=(i,T)来描述对象的特征,i表示对象的标识id,T表示对象的特征集合或列表,可以用T={t1,p1,t2,p2,...,tm,pm}来表示。
由于对象特征读取频繁,因此可以将对象特征信息预定存储在缓存中。通过采用缓存可以加快读取速度。在一种可能的实现方式中,存储在缓存中时可以用i作为Key,T作为Value。
3)记录用户会话中的近期的服务请求序列,并清除序列中与当前时间间隔超过设定阈值的请求。
其中,如上所述,可以采用一个二元组a=(UID,Ti)来描述用户请求序列。其中,UID表示用户的身份标识,Ti={i1,ti1,i2,ti2,...,in,tin}为该用户的请求序列。i为对象的唯一标识,tik表示用户UID对某一对象ik的一次请求(例如购买,浏览,评论等)所发生的时间。并且,设定最大请求有效时间(阈值)为tx,当前时间为ty,用户请求到来时,从前至后读取序列中的每一项,若ty-tik-1>=tx,ty-tik<tx,则将前k-1项移出序列,从而得到请求序列Ti={ik,tik,ik+1,tik+1,...,in,tin}。
4)对服务请求序列中的每次服务请求,读取其各对象的对象特征,并确定用户的当前兴趣特征(当前兴趣点),然后根据如上所述的公式1计算相应的特征权重,从而确定用户当前感兴趣的兴趣点及其权重。
其中,采用一个二元组d=(UID,T)来描述用户当前兴趣点。d表示用户当前兴趣点,UID表示用户的身份标识,T={t1,p1,t2,p2,...,tn,pn}表示该用户当前的n个兴趣点及其权重。
具体而言,当用户发生服务请求时,首先根据用户标识UID从a中获取该用户的请求序列Ti,即获取近期请求序列。对每一个请求中的对象i,从o(对象特征)中获取该对象的特征集合T,并确定T中存在的对象特征tl,然后利用上述公式1来计算对象特征tl的特征权重pl。并且,预先设定特征权重的阈值pmin,当计算出的pl>pmin时,将{tl,pl}加入到兴趣点列表d.T中,用以突出用户当前主要兴趣。其中,兴趣点详细计算方法可参考Rocchio算法中查询向量的计算方法。
此外,在用户当前兴趣点确定后,对请求序列a进行更新,将当前请求{in+1,tin+1}插入请求序列Ti的末尾,以使得能够在下次的服务请求中应用本次请求中的数据。
5)针对初始推荐信息列表里的每一个对象,获取其特征集合。并将所获取到的特征集合与用户当前兴趣点进行匹配,利用筛选器筛选出符合用户当前兴趣点的推荐结果,并计算出与兴趣点的贴近程度,其具体过程可参见图4。
6)加入覆盖用户当前兴趣点程度这一因素,利用排序器对筛选后的信息推荐列表重新排序,使符合用户当前兴趣的结果优先展示给用户并获取更好的展示位置。
在本实施例中,采用筛选器过滤掉没有涉及到用户当前兴趣点的推荐项,并重新调整推荐列表中符合用户当前兴趣点的对象权重,每当用户访问需要提供推荐服务的页面时触发一次筛选器来执行图4示出的筛选器的工作流程图。如图4所示,筛选器的工作流程图具体如下。
401)根据用户当前请求内容读取初始推荐信息列表r,例如:用户访问个人页面时,根据当前用户Id获取该用户的个性化推荐信息列表;用户浏览对象例如商品页面时,根据对象Id获取基于该对象的初始推荐信息列表等。
402)对初始推荐信息列表r按顺序依次读取每一条推荐对象信息(i,v)。
403)对该对象进行过滤。即判断用户例如在当天是否已对该对象i发生过如观看、购买、评论、评分等的行为。如果在当天对该对象发生过行为,则表明推荐系统在当天已经对用户采用过本发明实施例的信息推荐方法针对该对象进行过推荐,则不必再对该对象进行推荐。如果已对该对象发生行为,则返回步骤402读取下一条对象信息。
404)根据该对象信息中的对象标识i从对象的特征o中获取该对象的特征集合T’。
406)采用上述公式2来计算用户兴趣点T与对象特征集合T’的相似度L。然后,把L作为一部分权重加到已有的对象权重v中,即采用上述公式3来调整初始推荐信息列表中的各对象的对象权重。
407)将计算过的该条记录(i,v)输出给排序器,并回到步骤402读取下一条记录,直至读取完初始推荐信息列表中的所有信息。
在筛选器重新计算出初始推荐信息列表中各对象的对象权重v后,采用排序器依据筛选器重新计算后的对象权重v由大到小对筛选后的推荐结果重新排序,并根据前端页面展示需求获取前n个元素。其中,排序器可以采用公知的大顶堆方法进行处理,将每次筛选器传过来的对象信息放在堆末尾并进行一次向上调整,最后直接读取堆中从上至下,从左至右顺序的前n个元素并输出。此外,出于效率的考虑,可以忽略由于堆中同一层元素无序造成的最后几个元素顺序的误差。
这样,通过本发明实施例的信息推荐方法,能够基于用户近期的服务请求序列来确定用户当前感兴趣的特征点,并根据所确定的用户当前感兴趣的特征点来从推荐信息列表的众多信息中筛选出包含或贴近用户当前兴趣点的信息,并将这部分信息优先推荐给用户并在合适的位置展示,使最终推荐的内容既符合用户过往行为,又贴近用户当前兴趣点,从而保障了用户体验的一致性,提高了推荐服务的覆盖率、多样性、新颖性。通过本发明实施例的信息推荐方法,能够给用户推荐符合用户当前关注点的内容,提高了用户体验。
实施例4
图5示出根据本发明一实施例的信息推荐装置的结构框图。如图5所示,该信息推荐装置10包括:确定单元11,用于根据预定时间段内用户所请求的各第一对象的特征集合以及请求时间,来确定所述用户当前感兴趣的第二对象的特征集合;计算单元12,与所述确定单元11相连接,用于分别确定所述第二对象的特征集合与初始推荐信息中的各第三对象的特征集合的共同特征,并根据各共同特征分别计算相应的所述第三对象与所述第二对象的相似度;调整单元13,与所述计算单元12相连接,用于根据所计算出的各相似度来分别调整相应的所述第三对象的对象权重;以及排序单元14,与所述调整单元13相连接,用于根据调整后的各所述第三对象的对象权重对所述初始推荐信息重新进行对象排序,并根据排序结果重新向用户推荐信息。
对于上述信息推荐装置10,在一种可能的实现方式中,所述第一对象的特征集合包括所述用户所请求的第一对象的特征及其对应的特征权重,所述第二对象的特征集合包括所述用户当前感兴趣的第二对象的特征及其对应的特征权重。相应的,所述确定单元11包括:整合模块111,用于根据所述预定时间段内所有所述第一对象的特征集合,整合得到各待处理特征;调整模块112,与所述整合模块111相连接,用于根据所述待处理特征所在的各第一对象中的特征权重以及请求时间,来调整所述待处理特征的特征权重;以及加入模块113,与所述调整模块112相连接,用于在所述待处理特征的调整后的特征权重大于特征权重阈值的情况下,将所述待处理特征及其调整后的特征权重加入所述第二对象的特征集合。
对于上述信息推荐装置10,在一种可能的实现方式中,所述调整模块112用于:根据以下公式1,来调整所述待处理特征的特征权重,
其中,tl表示所述待处理特征,n表示所有所述第一对象中存在待处理对象特征tl的第一对象的个数,ptlk表示待处理对象特征tl所在的各第一对象中待处理对象特征tl的特征权重,tilk表示待处理对象特征tl所在的各第一对象的请求时间,pl表示调整后的待处理对象特征tl的特征权重,1≤k≤n,th表示当前时间,β表示比例调整参数。
对于上述信息推荐装置10,在一种可能的实现方式中,所述计算单元12用于:根据以下公式2,来计算相应的所述第三对象与所述第二对象的相似度,
其中,L表示所述第三对象与所述第二对象的相似度,m表示所述第三对象的特征集合与所述第二对象的特征集合的共同特征的个数,pj表示m个共同特征中的特征tj在所述第二对象的特征集合中的特征权重,pj'表示特征tj在所述第三对象中的特征集合中的特征权重。
对于上述信息推荐装置10,在一种可能的实现方式中,所述调整单元13用于:根据以下公式3,来调整相应的所述第三对象的对象权重,
v'=v+θL 公式3
其中,v表示所述初始推荐信息中的第三对象的对象权重,v'表示对所述第三对象的对象权重进行调整后的对象权重,θ表示比例调整参数。
本实施例的信息推荐装置10可以用于执行任一上述实施例中所阐述的信息推荐方法。上述信息推荐方法具体流程请参见上述实施例的详细阐述。
通过本发明实施例的信息推荐装置,能够基于用户近期的服务请求序列来确定用户当前感兴趣的特征点,并根据所确定的用户当前感兴趣的特征点来从推荐信息列表的众多信息中筛选出包含或贴近用户当前兴趣点的信息,并将这部分信息优先推荐给用户并在合适的位置展示,使最终推荐的内容既符合用户过往行为,又贴近用户当前兴趣点,从而保障了用户体验的一致性,提高了推荐服务的覆盖率、多样性、新颖性。通过本发明实施例的信息推荐装置,能够给用户推荐符合用户当前关注点的内容,提高了用户体验。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (8)
1.一种信息推荐方法,其特征在于,包括:
根据预定时间段内所有第一对象的特征集合,整合得到各待处理特征;
根据所述待处理特征所在的各第一对象中的特征权重以及请求时间,来调整所述待处理特征的特征权重;
在所述待处理特征的调整后的特征权重大于特征权重阈值的情况下,将所述待处理特征及其调整后的特征权重加入第二对象的特征集合;
获取初始推荐信息,分别确定所述第二对象的特征集合与初始推荐信息中的各第三对象的特征集合的共同特征,并根据各共同特征分别在第二对象与该第三对象中的特征权重,计算相应的所述第三对象与所述第二对象的相似度;
根据所计算出的各相似度来分别调整相应的所述第三对象的对象权重;以及
根据调整后的各所述第三对象的对象权重对所述初始推荐信息重新进行对象排序,并根据排序结果重新向用户推荐信息;
其中,所述特征集合包括各对象的特征及相应的特征权重。
5.一种信息推荐装置,其特征在于,包括:
确定单元,用于根据预定时间段内所有第一对象的特征集合,整合得到各待处理特征,根据所述待处理特征所在的各第一对象中的特征权重以及请求时间,来调整所述待处理特征的特征权重,在所述待处理特征的调整后的特征权重大于特征权重阈值的情况下,将所述待处理特征及其调整后的特征权重加入第二对象的特征集合;
计算单元,与所述确定单元相连接,用于获取初始推荐信息,分别确定所述第二对象的特征集合与初始推荐信息中的各第三对象的特征集合的共同特征,并根据各共同特征分别在第二对象与该第三对象中的特征权重,计算相应的所述第三对象与所述第二对象的相似度;
调整单元,与所述计算单元相连接,用于根据所计算出的各相似度来分别调整相应的所述第三对象的对象权重;以及
排序单元,与所述调整单元相连接,用于根据调整后的各所述第三对象的对象权重对所述初始推荐信息重新进行对象排序,并根据排序结果重新向用户推荐信息;
其中,所述特征集合包括各对象的特征及相应的特征权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610110002.5A CN105787055B (zh) | 2016-02-26 | 2016-02-26 | 信息推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610110002.5A CN105787055B (zh) | 2016-02-26 | 2016-02-26 | 信息推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105787055A CN105787055A (zh) | 2016-07-20 |
CN105787055B true CN105787055B (zh) | 2020-04-21 |
Family
ID=56402963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610110002.5A Active CN105787055B (zh) | 2016-02-26 | 2016-02-26 | 信息推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105787055B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014145088A1 (en) * | 2013-03-15 | 2014-09-18 | SHIMANOVSKY, Boris | Apparatus, systems, and methods for batch and realtime data processing |
CN106294628A (zh) * | 2016-07-28 | 2017-01-04 | 五八同城信息技术有限公司 | 推荐对象确定方法及装置 |
CN108270660A (zh) * | 2017-01-04 | 2018-07-10 | 腾讯科技(深圳)有限公司 | 消息的快捷回复方法及装置 |
CN106909629B (zh) * | 2017-01-26 | 2020-05-19 | 武汉奇米网络科技有限公司 | 一种个性化推荐坑位标签的方法及系统 |
CN110020112A (zh) * | 2017-09-25 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 对象推送方法及其系统 |
CN108491540B (zh) * | 2018-03-30 | 2022-02-22 | 北京百度网讯科技有限公司 | 文本信息推送方法、装置及智能终端 |
CN108763318B (zh) * | 2018-04-27 | 2022-04-19 | 达而观信息科技(上海)有限公司 | 物品推荐方法和装置 |
CN110807680B (zh) * | 2018-08-06 | 2023-05-02 | 阿里巴巴集团控股有限公司 | 数据对象信息处理方法、装置及电子设备 |
CN109388649B (zh) * | 2018-09-28 | 2022-05-13 | 土流集团有限公司 | 一种土地智能推荐方法及系统 |
CN111008339A (zh) * | 2019-11-27 | 2020-04-14 | 开普云信息科技股份有限公司 | 一种基于多元协同的内容智能推荐与分发方法及其系统 |
CN111460819B (zh) * | 2020-03-31 | 2023-06-20 | 湖南大学 | 基于细粒度情感分析的个性化评论文本推荐系统及推荐方法 |
CN111881352A (zh) * | 2020-07-28 | 2020-11-03 | 腾讯科技(北京)有限公司 | 内容推送方法、装置、计算机设备和存储介质 |
CN113901890B (zh) * | 2021-09-18 | 2022-10-14 | 深圳市银翔科技有限公司 | 一种身份识别的方法和视音频记录仪安全系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567392A (zh) * | 2010-12-24 | 2012-07-11 | 华东师范大学 | 一种基于时间窗口兴趣主题挖掘的控制方法 |
US8572097B1 (en) * | 2013-03-15 | 2013-10-29 | FEM, Inc. | Media content discovery and character organization techniques |
CN105224699A (zh) * | 2015-11-17 | 2016-01-06 | Tcl集团股份有限公司 | 一种新闻推荐方法及装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116589A (zh) * | 2011-11-17 | 2013-05-22 | 腾讯科技(深圳)有限公司 | 一种发送推荐信息的方法及装置 |
CN102411754A (zh) * | 2011-11-29 | 2012-04-11 | 南京大学 | 一种基于商品属性熵值的个性化推荐方法 |
CN102567511B (zh) * | 2011-12-27 | 2013-10-02 | 奇智软件(北京)有限公司 | 一种应用自动推荐的方法及装置 |
CN103455559B (zh) * | 2011-12-27 | 2016-11-16 | 北京奇虎科技有限公司 | 一种应用自动推荐的方法及装置 |
CN102831234B (zh) * | 2012-08-31 | 2015-04-22 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN103514239B (zh) * | 2012-11-26 | 2016-12-21 | Tcl美国研究所 | 一种集成用户行为和物品内容的推荐方法及系统 |
CN103425799B (zh) * | 2013-09-04 | 2016-06-15 | 北京邮电大学 | 基于主题的个性化研究方向推荐系统和推荐方法 |
CN104699687A (zh) * | 2013-12-04 | 2015-06-10 | 中国移动通信集团广东有限公司 | 一种物品推荐方法及服务器 |
CN104899195B (zh) * | 2014-01-26 | 2020-06-30 | 武汉联影医疗科技有限公司 | 一种个性化教育资源的推荐方法和装置 |
-
2016
- 2016-02-26 CN CN201610110002.5A patent/CN105787055B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567392A (zh) * | 2010-12-24 | 2012-07-11 | 华东师范大学 | 一种基于时间窗口兴趣主题挖掘的控制方法 |
US8572097B1 (en) * | 2013-03-15 | 2013-10-29 | FEM, Inc. | Media content discovery and character organization techniques |
CN105224699A (zh) * | 2015-11-17 | 2016-01-06 | Tcl集团股份有限公司 | 一种新闻推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105787055A (zh) | 2016-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105787055B (zh) | 信息推荐方法及装置 | |
Cheng et al. | MMALFM: Explainable recommendation by leveraging reviews and images | |
US20220035827A1 (en) | Tag selection and recommendation to a user of a content hosting service | |
WO2019148817A1 (zh) | 电商商品推荐方法和电商平台服务器 | |
US9298809B2 (en) | System, apparatus, and method for recommending items | |
US11061973B2 (en) | Incorporating user usage of consumable content into recommendations | |
US20170185894A1 (en) | End-to-end deep collaborative filtering | |
US8903822B2 (en) | Apparatus and method for measuring contents similarity based on feedback information of ranked user and computer readable recording medium storing program thereof | |
WO2015188349A1 (en) | Recommending of an item to a user | |
US20190012719A1 (en) | Scoring candidates for set recommendation problems | |
CN110175895B (zh) | 一种物品推荐方法及装置 | |
JP6967462B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
US10970296B2 (en) | System and method for data mining and similarity estimation | |
US10380209B2 (en) | Systems and methods of providing recommendations of content items | |
CN109063120B (zh) | 一种基于聚类的协同过滤推荐方法和装置 | |
CN106952111B (zh) | 个性化推荐方法及装置 | |
US20150206220A1 (en) | Recommendation Strategy Portfolios | |
CN112733006B (zh) | 用户画像的生成方法、装置、设备及存储介质 | |
Kim et al. | Recommender systems using SVD with social network information | |
US20180165741A1 (en) | Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program | |
CN105279172B (zh) | 视频匹配方法和装置 | |
JP7043243B2 (ja) | 分類装置、分類方法、およびプログラム | |
JP5774535B2 (ja) | コンテンツ推薦プログラム、コンテンツ推薦装置及びコンテンツ推薦方法 | |
Ye et al. | A collaborative neural model for rating prediction by leveraging user reviews and product images | |
CN110825967A (zh) | 一种提高推荐系统多样性的推荐列表重排名方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200427 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Patentee after: Alibaba (China) Co.,Ltd. Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C Patentee before: Youku Internet Technology (Beijing) Co.,Ltd. |
|
TR01 | Transfer of patent right |