CN102508894B

CN102508894B - 一种数字信息推荐预测模型的训练方法和系统

Info

Publication number: CN102508894B
Application number: CN201110339736.8A
Authority: CN
Inventors: 鲁凯; 王斌; 史亮; 李文娜; 李锐; 徐飞
Original assignee: Institute of Computing Technology of CAS
Current assignee: Shanghai Zuoanxinhui Electronic Technology Co., Ltd.
Priority date: 2011-11-01
Filing date: 2011-11-01
Publication date: 2014-05-07
Anticipated expiration: 2031-11-01
Also published as: CN102508894A

Abstract

本发明提供一种数字信息推荐预测模型的训练方法和系统，该方法包括：1)接收打分数据；2)建立模型并利用所述打分数据训练所述模型，其中所述模型中包括打分时间段对用户的影响参数。本发明所训练的预测模型考虑到用户打分的时间与所打分数之间的规律性关系，具有较好的推荐效果。

Description

一种数字信息推荐预测模型的训练方法和系统

技术领域

本发明涉及数字信息处理领域，具体地，涉及数字信息推荐领域。

背景技术

随着互联网的快速发展，用户在各个门户网站、电子商务网站、视频或者音乐视听网站都面临信息过载的问题，因此挖掘用户的可能喜好，提供个性化的服务对提高用户的满意度和忠诚度具有非常重大的意义。推荐系统正是在这个背景产生的，并且近二十年来得到了非常迅猛的发展。IT巨头如亚马逊，谷歌，雅虎等，国内如当当网，淘宝网等都在其不同的应用中提供了个性化的推荐系统，极大的方便了用户并且也给商家带来了巨大的利益。

推荐系统大致可以分为两类：基于内容的推荐系统及基于协同过滤的推荐系统。基于内容的推荐系统主要是利用项目(item)的内容信息，例如项目名字等文字信息来找出相似的项目集合，然后根据用户喜欢的项目推荐该项目的相似项目。基于协同过滤的推荐系统主要是利用用户对项目的反馈，例如用户对项目的打分记录，购买记录，浏览记录等挖掘用户的可能喜好，推荐其可能喜欢的项目集合。

因为基于内容的推荐系统只与当前用户选择的项目有关，该方法没有考虑到对用户的历史行为进行建模，因此该方法无法满足用户的个性化需求。

对于基于协同过滤的推荐系统，其推荐过程主要包括下列步骤：第一步获得用户对各个音乐的打分情况，然后对打分数据进行预处理；第二步是使用相关协同过滤的相关算法对打分数据进行建模，预测，这个过程是离线完成的；第三步是对于每个活跃用户，将预测完的该用户对各个音乐的可能打分值取最高的前K个(Top-K)项目进行在线推荐。图1示出了上述推荐过程的流程图。这类系统不需要考虑项目的属性以及领域知识即可获得很好的推荐效果，因此大多数推荐系统都是基于协同过滤技术的。然而由于在实际中用户的打分数往往比较少，所以协同过滤技术在应用时面临很多问题，例如冷启动问题，数据稀疏问题等。其中数据稀疏性对产生精确推荐往往造成很大的影响。

上述推荐系统均为考虑到用户打分随时间变化而呈现的规律性变化，从而未能准确地为用户进行期望信息的推荐。

发明内容

本发明的目的在于提供一种推荐效果更理想的数字信息推荐预测模型的训练方法及系统。

根据本发明的一个方面，提供了一种数字信息推荐预测模型的训练方法，包括：

1)接收打分数据；

2)建立模型并利用所述打分数据训练所述模型，其中所述模型中包括打分时间段对用户的影响参数。

上述方法中，所述模型还包括：打分时间段对用户偏差的影响参数。

上述方法中，所述模型还包括：(r_uj-b_uj)的补偿参数，

其中r_uj表示已知的用户u对项目j打分的打分值，b_uj表示用户u对项目j打分的打分值相对于平均打分值的偏差，其中项目表示数字信息的类别的具体内容。

上述方法中，所述(r_uj-b_uj)的补偿参数的系数为(|(R^k(i；u)|+1)^-1/2，

其中R^k(i；u)＝R(u)∩S^k(i)，其中R(u)是用户打分值已知的项目集合，S^k(i)表示与项目i最相似的k个项目的集合。

上述方法中，所述模型还包括：隐式反馈。

上述方法中，所述隐式反馈的系数为(|N^k(i；u)|+1)^-1/2，

其中N^k(i；u)＝N(u)∩S^k(i)，其中N(u)是用户打过分的项目集合，S^k(i)表示与项目i最相似的k个项目的集合。

上述方法中，所述S^k(i)是基于打分的项目相似集合、基于所述类别之间存在的关联关系的项目相似集合和基于内容的项目相似集合中的任意一个或任意二或三个的融合结果。

上述方法中，所述步骤2)中所述建立模型是基于隐参数模型建立。

上述方法中，所述步骤2)的所述训练是基于最小化损失函数来训练。

上述方法中，所述最小化损失函数的求解是采用梯度下降法。

根据本发明另一方面，还提供了一种数字信息推荐预测模型的训练系统，包括：

接收模块，用于接收打分数据；

建模模块，用于建立模型并利用所述打分数据训练所述模型，其中所述模型中包括打分时间段对用户的影响参数。

根据本发明另一方面，还提供了一种数字信息推荐方法，包括：利用根据上述训练方法训练的模型进行数字信息推荐。

根据本发明另一方面，还提供了一种数字信息推荐系统，用于利用根据上述训练方法训练的模型进行数字信息推荐。

本发明所训练的预测模型考虑到用户打分的时间与所打分数之间的规律性关系，具有较好的推荐效果。

附图说明

图1是基于协同过滤的推荐方法的流程图；

图2是根据本发明优选实施例的打分数据集划分示意图；

图3是根据Yahoo！Music打分数据集的时间段划分示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对根据本发明一个实施例的数字信息推荐预测模型的训练方法和系统进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

通常，由于用户每天在不同的时间段心情状态不同，所以在不同时间段具有不同的打分倾向。例如，用户白天在工作时间可能比较忙碌，压力相对有点大，这时他可能变得有一点苛刻，那么他的打分值相对比较低。然而到了夜晚之后，因为要做的事情相对比较少，心情比较轻松，所以这个时候他可能选择听一些自己喜欢听的音乐，打的分值相对较高。基于这一客观规律，本发明提供了一种推荐效果更好的数字信息推荐预测模型的训练方法和系统。

在详细介绍本发明的训练方法前，首先介绍下本发明所涉及到的符号定义：

用u，v指代用户，用i，j指代项目，其中项目包括歌曲、专辑、流派和演唱家；

用m表示用户总数，n表示项目的总数；

r_ui是已知的u对i打分的打分值；

是对r_ui的预测值；

定义R是打分值已经知道的(u，i)集合：R＝{(u，i)|r_ui是已经知道的}；

定义N是所有的打过分的(u，i)集合，即使打分值尚未知道：

定义T是测试集的打分集合；

定义R(u)是打分值已知的u打分的项目，N(u)是u打过分的所有项目集合：

下面根据本发明一个优选实施例，详细介绍本发明的训练方法所涉及的步骤，主要包括打分数据的预处理和根据预处理后的打分数据建立和训练预测模型。

1.打分数据的预处理

首先，获取用户对音乐项目的打分情况；然后，对打分数据进行预处理。优选地，预处理过程包括删除打分总数很少的用户、总的打分数很少的项目，以及不满足打分要求的打分。预处理的主要步骤如下：

(1)对于打分数据中的每个打分，如果打分值不在规定的范围内则删除该打分，该规定的范围例如[0-5]或[0-100]；

(2)对于给出打分数据的每个用户，如果该用户的打分总数小于规定的阈值(如10)，那么删除与该用户的所有打分数据，不使用该用户进行建模；

(3)对于打分数据中的每个项目(item)，如果给该项目打分的用户总数小于规定的阈值，例如10，那么删除该项目的所有分数，不使用该项目进行建模。

根据该优选实施例，经过预处理的打分数据格式如下，对于每个用户有：

用户ID，音乐项目ID，打分值，打分日期，打分的具体时间。

优选地，对于经过预处理的打分数据集，按照一定比例将每个用户的打分集合根据用户打分时间的先后顺序进行划分，主要分为三个部分：训练集、验证集和测试集，其中训练集和验证集用于学习模型的参数，测试集主要用来评估模型的好坏。参见图2，根据本发明的一个优选实施例，80％的打分数据属于训练集，10％的打分数据属于验证集，10％的打分数据属于测试集。

2.建立预测模型

根据本发明的优选实施例，基于隐参数模型来建立本发明的预测模型。本领域普通技术人员可以理解，也可以基于图挖掘或者矩阵分解等方法来建立本发明的预测模型。

经典的隐参数模型(SVD)是通过发掘已知打分值潜在的特征来表示预测的打分值。该情况下，SVD的模型形式如下：

{\hat{r}}_{ui} = μ + b_{i} + b_{u} + q_{i}^{T} p_{u}

其中μ是所有已知打分值的平均打分值，其根据已知打分值直接计算。b_u表示的是用户u所打的打分值相对于平均打分情况的偏差，b_i表示的是关于项目i的打分值相对于平均打分的偏差。p_u是和用户u相关的特征向量，其中的每个元素表示和用户u相关的隐参数。q_i是和项目i相关的特征向量，其中的每个元素表示和项目i相关的隐参数。

根据关于用户打分时间与用户所打分数值之间的规律的分析，可以将一天划分为不同的时间段。例如将一天分为{上午，下午，夜晚}。当然，也可以根据打分数据集采用其它的划分方法。图3示出了根据Yahoo！Music打分数据集的时间段划分示意图，如图所示，将一天划分为4个阶段，根据本发明的一个优选实施例，每个时间段所对应的系数如下：

基于上面打分时间与分数值之间的关系，在经典隐参数模型上进行扩展，可以得到如下的模型：

\hat{r_{u, i}} (t) = b_{ui} + b_{u, period (t)} + {q_{i}}^{T} (p_{u} + p_{u, period (t)}) - - - (1)

其中b_ui＝μ+b_u+b_i，t是特定的打分时间，其不依赖于具体的打分日期，period(t)表示打分时间段所对应的系数，b_u，period(t)表示打分时间段对用户偏差的影响参数，p_u，period(t)表示打分时间段对用户的影响参数。本领域普通技术人员可以理解，上述参数b_u，period(t)也可以不存在。

对于该模型中变量，可以利用训练集的打分数据采用最小化损失函数来求解，即对于打分集合，最小化所有打分的预测结果和真实结构之间的误差和进行求解，其中损失函数的形式如下：

\min_{b_{*}, q_{*}, p_{*}, y_{*} {agt}_{*}} \underset{(u, i) &Element; R}{Σ} {(r_{ui} - \hat{r_{u, i}})}^{2} + λ_{bu} b_{u}^{2} + λ_{bped} b_{u, period (t)}^{2} + λ_{bi} b_{i}^{2} + λ_{pu} {| | p_{u} | |}^{2} + λ_{ped} p_{u, period (t)}^{2}

λ_{qi} {| | q_{i} | |}^{2}

其中λ_*(λ_bu，λ_bi，λ_bped.λ_pu，λ_ped，λ_qi)表示损失函数的正规化因子，||*||表示的是向量*的模，对于该最小损失函数的求解可以采用梯度下降法。具体地，首先给每个变量赋一个范围在例如[-0.1，0.1]的任意初值，然后根据如下迭代公式进行迭代，当损失函数的值最小时得到迭代结果。其中所涉及的迭代公式如下：

b_{u} &LeftArrow; b_{u} + γ_{b_{u}} \cdot (e_{ui} - λ_{b_{u}} \cdot b_{u})

b_{u，period(t)}←b_u，perid(t)+γb_ped·(e_ui-λ_bped·b_{u，period(t)})

b_{i} &LeftArrow; b_{i} + γ_{b_{i}} \cdot (e_{ui} - λ_{b_{i}} \cdot b_{i})

p_{u} &LeftArrow; p_{u} + γ_{p_{u}} \cdot (e_{ui} \cdot q_{i} - λ_{p_{u}} \cdot p_{u})

q_{i} &LeftArrow; q_{i} + γ_{q_{i}} \cdot (e_{ui} \cdot p_{u} - λ_{q_{i}} \cdot q_{i})

p_{u，period(t)}←p_{u，period(t)}+γ_ped·(e_ui·q_i-λ_ped·p_u)

其中

r_*表示模型的学习速率(learning rate)，λ_*表示正规化因子，r_*，λ_*统称为元参数。

根据本发明的一个优选实施例，利用验证集的打分数据基于公式(3)的模型进行学习，具体地，可以采用交叉验证或自动参数学习等方法来求解元参数。

本领域普通技术人员可以理解，根据短时间动态信息(temporalinformation)的使用方法，参见2009年Y.Koren在Proc.15^th ACM SIGKDDInternational Conference on Knowledge and Discovery and DataMining(KDD’09)上发表的Collaborative Filtering with Temporal Dynamics一文，也可以综合用户的动态时间信息以及项目的动态时间信息等来建立本发明的上述模型，以达到更加准确的预测结果。

根据本发明一个优选实施例，在公式(1)所表示的模型的基础上，还融合项目相似度因素。

目前主流的考虑到项目相似度因素的推荐系统都是基于对项目的打分计算项目之间的相似度，然后采用邻居模型进行推荐，这种方法的不足是没有考虑到项目的领域知识，并且推荐的精确度在打分数据稀疏的情况也比较差。本发明为弥补这一不足提出了基于打分、音乐层次结构和内容三者融合的计算项目相似邻居的方法。首先分别介绍计算三个项目相似集合的方法：

1)基于音乐层次结构的项目相似集合计算方法

音乐类别通常可以分为：歌曲，专辑，演唱家，流派，并且这些类别之间存在一种层次结构，不同类别在层次结构中可能存在关联关系。每个类别中包括多个项目，也就是说项目是指类别中的具体内容，例如演唱家类别中包括：李谷一、孙燕姿、孙楠等，流派类别包括：抒情、欢快等。

由于音乐类别之间存在层次关系，并且不同类别之间存在关联关系，因此可以利用这一关联关系计算项目相似集合。具体地，根据音乐的四种类别：歌曲，专辑，演唱家，流派的不同采用如下步骤计算各自的项目相似集合：

对于每个歌曲i，它最相似的项目包括它所属于的专辑，演唱家和流派。因此，首先，选择在同一张专辑中的和该i具有相同流派的歌曲。然后，选择其他专辑中满足以下条件的歌曲：a)和i具有相同的流派，b)被打分数大于规定的阈值。最后，按照所选歌曲的打分数将所选歌曲降序排序。

对于每张专辑i，它最相似的项目包括它所属于的演唱家，相关的类别，以及它包含的歌曲中和它具有相同流派的歌曲。因此，选择其他的专辑和歌曲中打分数大于规定阈值并且和i具有的相同流派的专辑和歌曲。然后按照打分数降序排序。

对于每个演唱家i，选择该演唱家演唱的的K1个打分次数最多的专辑和歌曲，然后选择K2个与上说选择的专辑以及歌曲关联个数最多的流派。

对于每个流派i，首先，选择属于该流派的K个打分次数最多的歌曲和专辑，然后，选择K个和流派i相关的歌曲和专辑关联最多的演唱家。

通常，限定每个项目相似集合的个数K，当超过K时只取K个相似的项目，以此获得i的通过层次结构计算的项目相似集合SH(i)，规定为i的基于层次结构计算的相似项目的集合。

2)基于打分的项目相似集合计算方法

基于打分的相似度计算方法最常用的是采用皮尔森系数来计算两个项目之间的相似度。在计算项目的相似邻居集合时，采用亚马逊(Amazon)的算法，具有比较高的计算效率，主要求解过程如下：

(I)输入打分数据集；

(II)遍历打分数据中的每个项目，设当前项目为I1；

(III)遍历对I1打过分的所有用户，设当前用户为U；

(IV)遍历U打过分的所有项目，设当前项目为I2；如果I1和I2不同，并且I2还没有遍历过，将I2放入队列Q，

(V)反复执行(III)，(IV)直到遍历完所有的打分。

(VI)对于Q中的每个项目I2，计算I1和I2的相似度val；然后插入到集合S中，即：S[I1][I2]＝val。

(VII)反复执行步骤(II)至(VI)，直到计算完所有的项目获得相似度矩阵S。

预设一个阈值，规定当相似度大于该阈值时认为项目之间是相似的，以此获得i的基于分数计算的项目相似集合SR(i)。

3)基于内容的项目相似集合计算方法

由于可以获得音乐的名字，因此也可以利用音乐项目的内容用来计算项目的相似度。根据本发明一个优选实施例，两个项目之间基于内容的相似度通过计算两个音乐名字的最长公共字串得到，并当相似度大于一定阈值时认为两个项目是相似的，以此获得i的基于内容的项目相似集合SC(i)。其中计算相似度的计算方式如下：

(I)假设两个项目涉及的字符串分别为A，B，其中A的长度为M，B的长度为N，LCS[m][n]表示字符串A中第1至m个字符组成的子串与B中第1至n个字符组成的子串的最大公共字串的长度，其中a和b分别属于A和B；

(II)LCS的迭代公式如下：

其中A[m-1]表示字符串A中第m-1个元素，B[n-1]表示字符串B中第n-1个元素；

(III)字符串A，B的相似度为LCS[M][N]/max(M，N)，其中max(M，N)表示M，N中的最大值。

类似地，也可基于音乐的标签(Tag)信息计算基于内容的项目相似集合。

利用以下步骤，将上述步骤计算的项目相似集合：SR(i)，SH(i)，SC(i)整合为一个集合：按照项目在上述三个集合中的出现次数由大到小进行排序；当出现次数相同时，按照所属集合SR(i)，SH(i)，SC(i)的前后顺序进行排序。由此获得项目i的项目相似集合S(i)。

本领域普通技术人员可以理解，为了提高计算效率，可以取项目相似集合S(i)中的前K个元素用于计算。

考虑了项目相似度后，建立基于用户打分时段和邻居的预测模型形式如下：

\hat{r_{u, i}} (t) = b_{ui} + b_{u, period (t)} + {q_{i}}^{T} (p_{u} + p_{u, period (t)} + {(| (R^{k} (i; u) | + 1)}^{- 1 / 2} \underset{j &Element; R^{k} (i; u)}{Σ} (r_{uj} - b_{uj}) w_{ij}

(2)

+ {(| N^{k} (i; u) | + 1)}^{- 1 / 2} \underset{j &Element; N^{k} (i; u)}{Σ} c_{ij})

这里R^k(i；u)＝R(u)∩S^k(i)，N^k(i；u)＝N(u)∩S^k(i)，R(u)表示的是用户已经打分的项目集合，S^k(i)表示项目i最相似的k个项目，R^k(i；u)表示的是用户u的打分集合中和项目i最相似的k个项目集合；N(u)表示用户的所有打过分的项目集合，N^k(i；u)表示的是用户u所有的打分集合中和项目i最相似的k个项目集合。S^k(i)是指项目i的最相似的k个邻居集合，项目i的项目相似集合S(i)中前k个元素组成的集合。w_ij可以看作是(r_uj-b_uj)的补偿，c_ij是可以看作是隐式反馈。

与公式(1)表示的模型类似，采用如下最小化损失函数计算相关变量：

\min_{b_{*}, q_{*}, p_{*}, y_{*} {agt}_{*}} \underset{(u, i) &Element; R}{Σ} {(r_{ui} - \hat{r_{u, i}})}^{2} + λ_{bu} b_{u}^{2} + λ_{bi} b_{i}^{2} + λ_{pu} {| | p_{u} | |}^{2} + λ_{pi} {| | q_{i} | |}^{2} + λ_{w} \underset{j &Element; R^{k} (i; u)}{Σ} {| | w_{ij} | |}^{2} + λ_{c} \underset{j &Element; N^{k} (i; u)}{Σ} {| | c_{ij} | |}^{2}

其中所涉及的迭代公式如下：

b_{u} &LeftArrow; b_{u} + γ_{b_{u}} \cdot (e_{ui} - λ_{b_{u}} \cdot b_{u})

b_{u，period(t)}←b_{u，period(t)}+γ_bped·(e_ui-λ_bped·b_{u，period(t)})

b_{i} &LeftArrow; b_{i} + γ_{b_{i}} \cdot (e_{ui} - λ_{b_{i}} \cdot b_{i})

p_{u} &LeftArrow; p_{u} + γ_{p_{u}} \cdot (e_{ui} \cdot q_{i} - λ_{p_{u}} \cdot p_{u})

q_{i} &LeftArrow; q_{i} + γ_{q_{i}} \cdot (e_{ui} \cdot p_{u} - λ_{q_{i}} \cdot q_{i})

p_{u，period(t)}←p_u+γ_ped·(e_ui·q_i-λ_ped·p_{u，period(t)})

&ForAll; j &Element; R^{k} (i; u)

w_ij←w_ij+λ_w((|R^k(i；u)|+1)^-1/2e_ui(r_uj-b_uj)-λ_w·w_ij)

&ForAll; j &Element; N^{k} (i; u)

c_ij←c_ij+γ_c((|N^k(i；u)|+1)^-1/2e_ui-λ_c·c_ij)

本领域普通技术人员可以理解，上述公式(2)中所给出的模型仅为示例，可以对其进行各种变化，例如对扩展项

进行改变，其中可以将求和公式的系数(|(R^k(i；u)|+1)^-1/2改变为(|(R^k(i；u)|+1)的其他次方，也可以改变为仅包含(R^k(i；u)的表达式，甚至该系数可以为1。

下面结合已经划分的打分数据和建立的预测模型来详细描述根据本发明一个优选实施例的预测模型的训练和评价过程。涉及到的评价指标主要包括：

1)平均绝对偏差MAE：通过计算预测的用户打分与实际的用户打分之间的偏差度量预测的准确性。MAE越小，推荐的准确度越高。计算公式如下：

MAE = \frac{\underset{(u, i) &Element; T}{Σ} | r_{ui} - \hat{r_{ui}} |}{| T |}

2)根平均方差RMSE：该评价指标使得预测偏差大的分量在最终的偏差中所占的比重较大。与平均绝对偏差一样，根平均方差越低，推荐准确度越高。计算公式如下：

RMSE = \sqrt{\frac{\underset{(u, i) &Element; T}{Σ} {(r_{ui} - \hat{r_{ui}})}^{2}}{| T |}}

训练过程主要是利用训练集和验证集，具体过程如下：

首先，给元参数(学习速率和正规化因子)设定初始值。然后采用自动参数学习或者交叉验证的方法，每次在训练集合上迭代一次之后，在验证集上计算模型的RMSE或MAE并根据计算结果调整元参数的值。经过迭代预定的次数后，获得预测模型中元参数的值；

然后，将模型中相关变量如b_u，b_i，p_u，p_i，w_ij，c_ij设置为[-0.1，0.1]内的随机数，利用学习好的元参数在训练集上根据上述迭代公式进行迭代，每迭代一次后在验证集上进行评价，计算RMSE或者MAE，当RMSE或者MAE不再下降时，迭代终止，计算出迭代次数。

经过训练参数之后，即可获得最终所需的预测模型，可以基于该预测模型对每个活跃用户的没有打过分的项目进行预测，然后取预测值最高的K个项目推荐给用户。

测试集用于评价如上训练的模型的质量。具体地，采用经过训练集和验证集训练好的元参数和迭代次数，然后将训练集和验证集合并起来，在合并后的集合上进行迭代，当达到规定的迭代次数后迭代终止，然后使用学习到的b_u，b_i，p_u，p_i，w_ij，c_ij，来预测测试集中用户对给定项目的可能打分，并根据和用户实际的打分的比较计算预测的误差。

基于该评价质量的方法，在雅虎音乐提供的打分数据集上进行了实验，雅虎音乐是经过11年收集用户的打分数据得到的，其打分数据的主要内容如表1：

表1

用户数	项目总数	打分总数	验证集打分数	测试集总数
					1,000,990	624,961	262,810,175	4,003,690	6,005,940

其中项目中类别的个数如表2：

表2

项目总数	歌曲数	专辑数	演唱家数	流派数
					624,961	507172	88909	27888	992

其中打分值是在[0-100]的整数。在设置隐参数模型中的涉及到的向量(p_u，q_i)维数为50时，在验证集和测试集上的根平均误差RMSE结果如表3：

表3

由表3可以明确看出，本发明的预测模型根平均误差明显小于经典模型的根平均误差，也就是说，本发明的预测模型具有较理想的推荐效果。

本领域普通技术人员可以理解，上面以音乐推荐预测模型的训练为例来说明本发明的训练方法和系统，但是该训练方法不仅仅可以用于训练音乐推荐预测系统，也可以用于例如电影，电子商务等其他数字信息的推荐预测系统。有理由相信本发明对于提高用户对推荐效果的满意度，增加用户的忠诚度，进而为服务提供商带来巨大的商业利润具有很大的潜在价值。

应该注意到并理解，在不脱离后附的权利要求所要求的本发明的精神和范围的情况下，能够对上述详细描述的本发明做出各种修改和改进。因此，要求保护的技术方案的范围不受所给出的任何特定示范教导的限制。

Claims

1.一种数字信息推荐预测模型的训练方法，包括：

1）接收打分数据；

2）建立模型并利用所述打分数据训练所述模型，所述模型形式如下：

\begin{matrix} {\hat{r}}_{u, i} = b_{ui} + q_{i}^{T} (p_{u} + p_{u, period (t)} + {(| R^{k} (i; u) | + 1)}^{- 1 / 2} \underset{j &Element; R^{k} (i; u)}{Σ} (r_{uj} - b_{uj}) w_{ij} \\ + {(| N^{k} (i; u) | + 1)}^{- 1 / 2} \underset{j &Element; N^{k} (i; u)}{Σ} c_{ij}) \end{matrix}

其中，b_ui=μ+b_u+b_i，μ是所有已知打分值的平均值，b_u是用户u所打分值相对于平均打分的偏差，b_i是关于项目i的打分值相对于平均打分的偏差，q_i是和项目i相关的特征向量，p_u是和用户u相关的特征向量，p_u,period(t)是打分时间段t对用户的影响参数；r_uj表示已知的用户u对项目j打分的打分值，b_uj表示用户u对项目j打分的打分值相对于平均打分值的偏差，w_ij是(r_uj-b_uj)的补偿，其中项目表示数字信息的类别的具体内容，R^k(i;u)=R(u)∩S^k(i)，其中R(u)是用户打分值已知的项目集合，S^k(i)表示与项目i最相似的k个项目的集合；c_ij是隐式反馈，N^k(i;u)=N(u)∩S^k(i)，其中N(u)是用户打过分的项目集合。

2.根据权利要求1所述的方法，其特征在于，所述模型还包括：打分时间段对用户偏差的影响参数。

3.根据权利要求1所述的方法，其特征在于，所述S^k(i)是基于打分的项目相似集合、基于所述类别之间存在的关联关系的项目相似集合和基于内容的项目相似集合中的任意一个或任意二或三个的融合结果。

4.根据权利要求1或2所述的方法，其特征在于，所述步骤2）中所述建立模型是基于隐参数模型建立。

5.根据权利要求1或2所述的方法，其特征在于，所述步骤2）的所述训练是基于最小化损失函数来训练。

6.根据权利要求5所述的方法，其特征在于，所述最小化损失函数的求解是采用梯度下降法。

7.一种数字信息推荐预测模型的训练系统，包括：

接收模块，用于接收打分数据；

建模模块，用于建立模型并利用所述打分数据训练所述模型，所述模型形式如下：

\begin{matrix} {\hat{r}}_{u, i} = b_{ui} + q_{i}^{T} (p_{u} + p_{u, period (t)} + {(| R^{k} (i; u) | + 1)}^{- 1 / 2} \underset{j &Element; R^{k} (i; u)}{Σ} (r_{uj} - b_{uj}) w_{ij} \\ + {(| N^{k} (i; u) | + 1)}^{- 1 / 2} \underset{j &Element; N^{k} (i; u)}{Σ} c_{ij}) \end{matrix}

8.根据权利要求7所述的系统，其特征在于，所述模型还包括：打分时间段对用户偏差的影响参数。

9.一种数字信息推荐方法，包括：

利用根据权利要求1至6任一项所述的方法训练的模型进行数字信息推荐。

10.一种数字信息推荐系统，用于利用根据权利要求1至6任一项所述的方法训练的模型进行数字信息推荐。