CN105205128B - 基于评分特征的时序推荐方法及推荐装置 - Google Patents
基于评分特征的时序推荐方法及推荐装置 Download PDFInfo
- Publication number
- CN105205128B CN105205128B CN201510582507.7A CN201510582507A CN105205128B CN 105205128 B CN105205128 B CN 105205128B CN 201510582507 A CN201510582507 A CN 201510582507A CN 105205128 B CN105205128 B CN 105205128B
- Authority
- CN
- China
- Prior art keywords
- domain
- time
- sequential
- formula
- user interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000002123 temporal effect Effects 0.000 claims abstract description 23
- 241001269238 Data Species 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 230000008859 change Effects 0.000 claims description 14
- 206010068052 Mosaicism Diseases 0.000 abstract description 6
- 210000003765 sex chromosome Anatomy 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000009412 basement excavation Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000003090 exacerbative effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003733 optic disk Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于评分特征的时序推荐方法及推荐装置,其中,包括以下步骤:采集所有评分数据,并获取时间信息;将所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据;通过跨域时序协同过滤算法获取每个时间域上的用户兴趣、物品流行度与公共特征;通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值;如果共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域;对每个时间域上的训练数据进行预测,以进行推荐。本发明实施例的推荐方法,通过对每个时间域中的训练数据进行扩充,从而解决时序推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。
Description
技术领域
本发明涉及机器学习技术领域,特别涉及一种基于评分特征的时序推荐方法及推荐装置。
背景技术
随着推荐技术的发展,人们发现了用户的兴趣和物品的流行度随着时间会产生变化这一现象。即言,传统的静态推荐方法并没有利用时间信息对历史评分数据进行处理,所以不能很好地解决这一现象。因此,针对用户兴趣和物品流行度随时间动态变化这一现象,需要提出一种时序推荐方法以能够有效地解决这一问题。
相关技术中,时序推荐方法包括两种:时间权重推荐方法和时间切片推荐方法。其中,TWCF(Time Weight Collaborative Filtering,时间权重方法),将时间信息融入传统协同过滤推荐算法中,具体是在计算皮尔森相关系数时,将商品相似性项上乘上时间权重因子,并且在计算时间权重因子时,假定商品被评分离当前时间越远其对当前推荐活动影响越小,故可以用指数衰减公式计算。时间切片推荐方法是由Bin Li等人提出的CDCF-OT(Cross-Domain Collaborative Filtering over Time,跨域时序协同过滤算法)。在CDCF-OT技术中,将时间轴进行等时间段切分,通过这种处理,系统收集的所有评分数据被分到不同的时间段中,每个时间段的评分数据组成一个域,其中假定每个时间域内用户兴趣和物品流行度是不变的,在域间用户兴趣和物品流行度是变化的。参照图1所示,针对这种假设,时间切片推荐方法包括以下步骤:将评分数据集X按时间轴划为T个时间域,得到每个时间域上评分数据为X={X(1),X(2),…,X(T)};挖掘每个时间域中的用户兴趣P={P(1),P(2),…,P(T)}和物品流行度Q={Q(1),Q(2),…,Q(T)},并且得到所有时间域的公共特征B。其中假定每个时间域中的用户兴趣和物品流行度只受上一个域的影响;对每个时间域的评分进行预测
然而,相关技术中的时序推荐技术虽然在一定程度上解决了静态推荐技术中用户兴趣和物品流行度时序变化这一问题,但仍存在诸多问题。首先,时间权重式的时序推荐方法人为假定了距离当前时间越远的评分对当前的推荐影响越小,但是用户兴趣和物品流行度可能随时间会有周期性等变化,例如淘宝上凉鞋只在夏天很受欢迎。其次,在时间切片式的时序推荐方法中,虽然去掉了这一假设,从而可以刻画出用户兴趣和物品流行度的变化趋势,但是该方法为了刻画这种变化,将所有评分数据切分成若干个时间域,并在每个时间域上分别刻画,导致极大地加剧了评分数据的稀疏性,降低了每个时间域上刻画出来的用户兴趣和物品流行度的可靠性。在推荐技术中,评分数据的稀疏性极大地制约了推荐的质量。
发明内容
本发明旨在至少在一定程度上解决上述相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于评分特征的时序推荐方法,该推荐方法可以提高推荐质量,简单便捷。
本发明的另一个目的在于提出一种基于评分特征的时序推荐装置。
为达到上述目的,本发明一方面实施例提出了一种基于评分特征的时序推荐方法,包括以下步骤:采集用户的所有评分数据,并获取所述所有评分数据的时间信息,其中,所述时间信息包括起始时间与终止时间;根据所述时间信息将所述所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据;根据所述每个时间上的训练数据通过跨域时序协同过滤算法获取所述每个时间域上的用户兴趣、物品流行度与所述多个时间域的公共特征;通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值;如果对商品偏好的共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域的共同变化值大于所述预设值;以及根据扩充后的每个时间域的用户兴趣、物品流行度与所述多个时间域的公共特征对所述每个时间域上的训练数据进行预测,并根据预测结果进行推荐。
根据本发明实施例提出的基于评分特征的时序推荐方法,通过挖掘评分特征的变化,以对每个时间域上的评分数据进行扩充,增大每个时间域上的评分数据,从而解决时序推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。
另外,根据本发明上述实施例的基于评分特征的时序推荐方法还可以具有如下附加的技术特征:
优选地,在本发明的一个实施例中,所述距离公式可以为KL距离公式。
进一步地,在本发明的一个实施例中,通过所述KL距离公式获取所述相邻时间域之间用户兴趣与物品流行度的变化值的公式为:
其中,pu为用户u兴趣,qv为物品v流行度,n为时间域数量。
进一步地,在本发明的一个实施例中,根据以下公式得到所述预测结果,所述公式为:
其中,t为时间域,B为所述公共特征。
本发明另一方面实施例提出了一种基于评分特征的时序推荐装置,包括:采集模块,用于采集用户的所有评分数据,并获取所述所有评分数据的时间信息,其中,所述时间信息包括起始时间与终止时间;切分模块,用于根据所述时间信息将所述所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据;获取模块,用于根据所述每个时间上的训练数据通过跨域时序协同过滤算法获取所述每个时间域上的用户兴趣、物品流行度与所述多个时间域的公共特征;计算模块,用于通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值;收敛模块,如果对商品偏好的共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域的共同变化值大于所述预设值;以及预测模块,用于根据扩充后的每个时间域的用户兴趣、物品流行度与所述多个时间域的公共特征对所述每个时间域上的训练数据进行预测,并根据预测结果进行推荐。
根据本发明实施例提出的基于评分特征的时序推荐装置,通过挖掘评分特征的变化,以对每个时间域上的评分数据进行扩充,增大每个时间域上的评分数据,从而解决时序推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。
另外,根据本发明上述实施例的基于评分特征的时序推荐装置还可以具有如下附加的技术特征:
优选地,在本发明的一个实施例中,所述距离公式可以为KL距离公式。
进一步地,在本发明的一个实施例中,通过所述KL距离公式获取所述相邻时间域之间用户兴趣与物品流行度的变化值的公式为:
其中,pu为用户u兴趣,qv为物品v流行度,n为时间域数量。
进一步地,在本发明的一个实施例中,根据以下公式得到所述预测结果,所述公式为:
其中,t为时间域,B为所述公共特征。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为相关技术的跨域时序协同过滤算法示意图;
图2为根据本发明实施例的基于评分特征的时序推荐方法的流程图;
图3为根据本发明一个实施例的基于评分特征的时序推荐方法的流程图;以及
图4为根据本发明实施例的基于评分特征的时序推荐装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。
下面参照附图描述根据本发明实施例提出的基于评分特征的时序推荐方法及推荐装置,首先将参照附图描述根据本发明实施例提出的基于评分特征的时序推荐方法。参照图1所示,该时序推荐方法包括以下步骤:
S101,采集用户的所有评分数据,并获取所有评分数据的时间信息,其中,时间信息包括起始时间与终止时间。
S102,根据时间信息将所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据。
具体地,在本发明的一个具体实施例中,获取所有评分数据Xtrain的时间标签,从而得到所有评分的起始时间tstart和终止时间(当前时间)tend,将tend-tstart切分成16个时间域,从而得到每个时间域上的训练数据Xtrain={X1,X2,…,X16}。
S103,根据每个时间上的训练数据通过跨域时序协同过滤算法获取每个时间域上的用户兴趣、物品流行度与多个时间域的公共特征。
进一步地,将CDCF-OT方法在切分得到的评分数据集运行,得到每个时间域上的用户u兴趣物品流行度和所有时间域公共特征B。
S104,通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值。
优选地,在本发明的一个实施例中,距离公式可以为KL距离公式。
进一步地,在本发明的一个实施例中,通过KL距离公式获取相邻时间域之间用户兴趣与物品流行度的变化值的公式为:
其中,pu为用户u兴趣,qv为物品v流行度,n为时间域数量。
具体地,通过KL距离计算出两个时间域间用户兴趣和物品流行度的变化,公式(1)和(2)如下:
评分特征的变化由用户兴趣变化和物品流行度变化共同决定,计算如公式(3):
S105,如果对商品偏好的共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域的共同变化值大于预设值。
具体地,针对每个时间域t中的评分判断其评分特征在时间域t和t+1间的变化是否小于设定的阈值θ(θ可以为1),若小于θ,则将其扩充到时间域t+1中,在依次判断评分特征变化在t+1和t+2间是否小于θ,若小于继续扩充,直到评分特征在两个时间域间大于θ。
其中,重复S103到S105步骤5次(可认为已经收敛)。
S106,根据扩充后的每个时间域的用户兴趣、物品流行度与多个时间域的公共特征对每个时间域上的训练数据进行预测,并根据预测结果进行推荐。
进一步地,在本发明的一个实施例中,根据以下公式得到预测结果,公式为:
其中,t为时间域,B为公共特征。
进一步地,通过得到的用户兴趣p、物品流行度q和公共特征B,对用户-商品(u,v)组预测的评分为计算如公式(4):
在本发明的实施例中,本发明实施例以评分特征为基础,定义了评分特征变化趋势,并提出了挖掘评分特征变化趋势的方法。其中,本发明实施例通过迭代式扩充训练数据的方法,根据评分特征的变化趋势,对每个时间域中的训练数据进行扩充,并且利用评分特征解决时序推荐方法中数据稀疏性问题,能够有效地提高推荐质量。
在本发明的实施例中,最关键的是如何挖掘出评分特征,因此可以认为每个时间域中的评分特征由当前时间域的用户兴趣和物品流行度共同决定,而评分特征的变化是由两两时间域之间的评分特征变化大小决定。
在本发明的另一个具体实施例中,参照图3所示,本发明实施例以评分特征为基础,评分特征指某个时间域中用户对商品的喜好,简言之,包括以下步骤:
S201,根据训练数据时间信息,将评分数据切分成时间段相等的T个时间域。
S202,通过已有的时序推荐方法CDCF-OT提取出每个时间域中的用户兴趣和物品流行度。
S203,根据每个时间域上的用户兴趣和物品流行度,计算出每个时间域中的评分特征。然后,根据通过距离公式计算两个时间域中评分特征的变化程度。
S204,根据评分特征的变化对训练数据进行扩充。然后重复(2)至(4)到收敛。
S205,对训练数据进行预测。
根据本发明实施例提出的基于评分特征的时序推荐方法,通过挖掘评分特征的变化,以对每个时间域上的评分数据进行扩充,增大每个时间域上的评分数据,从而解决时序推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。
其次参照附图描述根据本发明实施例提出的基于评分特征的时序推荐装置。参照图4所示,该时序推荐装置10包括:采集模块100、切分模块200、获取模块300、计算模块400、收敛模块500和预测模块600。
其中,采集模块100用于采集用户的所有评分数据,并获取所有评分数据的时间信息,其中,时间信息包括起始时间与终止时间。切分模块200用于根据时间信息将所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据。获取模块300用于根据每个时间上的训练数据通过跨域时序协同过滤算法获取每个时间域上的用户兴趣、物品流行度与多个时间域的公共特征。计算模块400用于通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值。如果对商品偏好的共同变化值小于或等于预设值,收敛模块500用于将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域的共同变化值大于预设值。预测模块600用于根据扩充后的每个时间域的用户兴趣、物品流行度与多个时间域的公共特征对每个时间域上的训练数据进行预测,并根据预测结果进行推荐。本发明实施例的时序推荐装置10通过对每个时间域中的训练数据进行扩充,从而解决时序推荐中的稀疏性问题,提高推荐质量。
优选地,在本发明的一个实施例中,距离公式可以为KL距离公式。
进一步地,在本发明的一个实施例中,通过KL距离公式获取相邻时间域之间用户兴趣与物品流行度的变化值的公式为:
其中,pu为用户u兴趣,qv为物品v流行度,n为时间域数量。
进一步地,在本发明的一个实施例中,根据以下公式得到预测结果,公式为:
其中,t为时间域,B为公共特征。
需要说明的是,本发明实施例的装置的具体实现方式与方法部分的具体实现方式类似,为了减少冗余,此处不做赘述。
根据本发明实施例提出的基于评分特征的时序推荐装置,通过挖掘评分特征的变化,以对每个时间域上的评分数据进行扩充,增大每个时间域上的评分数据,从而解决时序推荐中的稀疏性问题,提高推荐质量,提高用户的使用体验。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种基于评分特征的时序推荐方法,其特征在于,包括以下步骤:
采集用户的所有评分数据,并获取所述所有评分数据的时间信息,其中,所述时间信息包括起始时间与终止时间;
根据所述时间信息将所述所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据;
根据每个时间域上的训练数据通过跨域时序协同过滤算法获取所述每个时间域上的用户兴趣、物品流行度与所述多个时间域的公共特征;
通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值;
如果相邻时间域之间用户兴趣与物品流行度的共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域之间的共同变化值大于所述预设值;以及
根据扩充后的每个时间域的用户兴趣、物品流行度与所述多个时间域的公共特征对所述每个时间域上的训练数据进行预测,并根据预测结果进行推荐。
2.如权利要求1所述的基于评分特征的时序推荐方法,其特征在于,所述距离公式为KL距离公式。
3.如权利要求2所述的基于评分特征的时序推荐方法,其特征在于,通过所述KL距离公式获取所述相邻时间域之间用户兴趣与物品流行度的变化值的公式为:
其中,pu为用户u兴趣,qv为物品v流行度,n为第n个时间域。
4.如权利要求3所述的基于评分特征的时序推荐方法,其特征在于,根据以下公式得到所述预测结果,所述公式为:
其中,t为第t个时间域,B为所述公共特征。
5.一种基于评分特征的时序推荐装置,其特征在于,包括:
采集模块,用于采集用户的所有评分数据,并获取所述所有评分数据的时间信息,其中,所述时间信息包括起始时间与终止时间;
切分模块,用于根据所述时间信息将所述所有评分数据切分成时间段相等的多个时间域,以得到每个时间域上的训练数据;
获取模块,用于根据每个时间域上的训练数据通过跨域时序协同过滤算法获取所述每个时间域上的用户兴趣、物品流行度与所述多个时间域的公共特征;
计算模块,用于通过距离公式获取相邻时间域之间用户兴趣与物品流行度的共同变化值;
收敛模块,如果相邻时间域之间用户兴趣与物品流行度的共同变化值小于或等于预设值,则将当前时间域对商品的评分扩充到相邻时间域,直至每个相邻时间域之间的共同变化值大于所述预设值;以及
预测模块,用于根据扩充后的每个时间域的用户兴趣、物品流行度与所述多个时间域的公共特征对所述每个时间域上的训练数据进行预测,并根据预测结果进行推荐。
6.如权利要求5所述的基于评分特征的时序推荐装置,其特征在于,所述距离公式为KL距离公式。
7.如权利要求6所述的基于评分特征的时序推荐装置,其特征在于,通过所述KL距离公式获取所述相邻时间域之间用户兴趣与物品流行度的变化值的公式为:
其中,pu为用户u兴趣,qv为物品v流行度,n为第n个时间域。
8.如权利要求7所述的基于评分特征的时序推荐装置,其特征在于,根据以下公式得到所述预测结果,所述公式为:
其中,t为第t个时间域,B为所述公共特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510582507.7A CN105205128B (zh) | 2015-09-14 | 2015-09-14 | 基于评分特征的时序推荐方法及推荐装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510582507.7A CN105205128B (zh) | 2015-09-14 | 2015-09-14 | 基于评分特征的时序推荐方法及推荐装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105205128A CN105205128A (zh) | 2015-12-30 |
CN105205128B true CN105205128B (zh) | 2018-08-28 |
Family
ID=54952811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510582507.7A Expired - Fee Related CN105205128B (zh) | 2015-09-14 | 2015-09-14 | 基于评分特征的时序推荐方法及推荐装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105205128B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106530010B (zh) * | 2016-11-15 | 2017-12-12 | 平安科技(深圳)有限公司 | 融合时间因素的协同过滤方法和装置 |
CN106649714B (zh) * | 2016-12-21 | 2020-08-04 | 重庆邮电大学 | 针对数据不均匀及数据稀疏的topN推荐系统及方法 |
CN109658210A (zh) * | 2019-02-18 | 2019-04-19 | 苏州大学 | 一种商品推荐方法、装置、设备以及存储介质 |
CN113781181B (zh) * | 2021-09-16 | 2024-03-05 | 中山大学 | 基于使用物品流行度辅助用户兴趣建模的推荐方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102208086A (zh) * | 2010-03-31 | 2011-10-05 | 北京邮电大学 | 面向领域的个性化智能推荐系统及实现方法 |
CN104463637A (zh) * | 2014-12-23 | 2015-03-25 | 北京石油化工学院 | 一种基于电商平台的商品推荐方法、装置及服务器 |
EP2860672A2 (en) * | 2013-10-10 | 2015-04-15 | Deutsche Telekom AG | Scalable cross domain recommendation system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013130834A1 (en) * | 2012-03-01 | 2013-09-06 | Qloo, Inc. | Personalized cross-domain recommender system |
-
2015
- 2015-09-14 CN CN201510582507.7A patent/CN105205128B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102208086A (zh) * | 2010-03-31 | 2011-10-05 | 北京邮电大学 | 面向领域的个性化智能推荐系统及实现方法 |
EP2860672A2 (en) * | 2013-10-10 | 2015-04-15 | Deutsche Telekom AG | Scalable cross domain recommendation system |
CN104463637A (zh) * | 2014-12-23 | 2015-03-25 | 北京石油化工学院 | 一种基于电商平台的商品推荐方法、装置及服务器 |
Non-Patent Citations (2)
Title |
---|
Cross-Domain Collaborative Filtering over Time;Bin Li et al;《Proceedings of the Twenty-Second International Joint Conference on Artificial Intelligence》;20111231;第2293-2298页 * |
Rating Knowledge Sharing in Cross-Domain Collaborative Filtering;Bin Li et al;《IEEE TRANSACTIONS ON CYBERNETICS》;20150531;第45卷(第5期);第1054-1068页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105205128A (zh) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110941740B (zh) | 视频推荐方法及计算机可读存储介质 | |
CN107220094B (zh) | 页面加载方法、装置和电子设备 | |
CN105205128B (zh) | 基于评分特征的时序推荐方法及推荐装置 | |
JP6487201B2 (ja) | 推奨ページを生成するための方法及び装置 | |
CN103500011B (zh) | 眼动轨迹规律分析方法和装置 | |
CN104503958B (zh) | 文档摘要的生成方法及装置 | |
CN102207950B (zh) | 电子装置和图像处理方法 | |
CN105117463B (zh) | 信息处理方法和信息处理装置 | |
CN104123351B (zh) | 交互式搜索方法和装置 | |
CN109903086A (zh) | 一种相似人群扩展方法、装置及电子设备 | |
CN104504101B (zh) | 一种相似视频的确定方法及装置 | |
CN105426404A (zh) | 一种音乐信息推荐方法、装置和终端 | |
US20170262447A1 (en) | Topical analytics for online articles | |
CN107992602A (zh) | 搜索结果展示方法和装置 | |
CN104484361B (zh) | 信息的展现方法及装置 | |
CN104702986B (zh) | 一种节目列表的排序方法及装置 | |
CN104079960A (zh) | 文件推荐方法和装置 | |
CN108009147B (zh) | 电子书封面生成方法、电子设备及计算机存储介质 | |
CN108388584A (zh) | 一种用于信息推荐的方法与装置 | |
CN104615749A (zh) | 铃音推荐方法及装置 | |
US10289624B2 (en) | Topic and term search analytics | |
CN108133058A (zh) | 一种视频检索方法 | |
CN104850537A (zh) | 对文本内容进行筛选的方法及装置 | |
CN115809371A (zh) | 基于数据分析的学习需求确定方法及系统 | |
CN109446206A (zh) | 用户饮食数据更新方法及更新系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180828 |
|
CF01 | Termination of patent right due to non-payment of annual fee |