CN107967627A

CN107967627A - 一种基于内容的线性回归理财产品推荐方法

Info

Publication number: CN107967627A
Application number: CN201711270746.4A
Authority: CN
Inventors: 张丝雨
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2017-12-05
Filing date: 2017-12-05
Publication date: 2018-04-27

Abstract

本发明公开一种改进的基于内容的线性回归方式进行理财产品推荐方法，使用现有基于内容的线性方式进行产品推荐时，在生成的回归方程中有些系数出现负数，表明该特性对用户购买该产品呈负相关，与实际应用场景相悖，产生过拟合现象。采用本发明理财产品推荐方法，能更直接找出错误产生的原因并进行改进，得出更优更符合实际情况的推荐。

Description

一种基于内容的线性回归理财产品推荐方法

技术领域

本发明属于大数据应用技术领域，尤其涉及一种基于内容的线性回归理财产品推荐方法。

背景技术

理财产品推荐方法是根据用户过去喜欢的产品，为用户推荐和他过去喜欢的产品相似的产品。该推荐方法一般包括以下三步：1.产品特征表示：为每个产品抽取出一些特征来表示此产品；2.用户偏好学习：利用一个用户过去喜欢(及不喜欢)的产品的特征数据，来学习出此用户的喜好特征；3.推荐生成：一个用户偏好和产品特征匹配的过程，为此用户推荐一组相关性最大的产品。

现有采用基于内容的线性方式进行产品推荐时，在回归方程求解中，有些系数出现负数，表明该特性对用户购买该产品呈负相关，但针对特定理财推荐的应用场景，理财产品的特征属性和一般商品的推荐不同，专家对理财产品其特征值的量化具有意义，例如产品收益值，产品灵活性，产品预期达成率，所属银行规模。分数越高代表该特性越优良，与群众喜好呈现正相关模式，如灵活性和收益的分值上，灵活性差的分值低，灵活性好的分值高，收益差的分值低，收益好的分值高，结合实际情况，该特性数值化后越高应该越受欢迎，但在训练的结果某些特征k的系数出现负数，从理论结果表示该特征分值越大，用户越不喜欢该产品，与实际情况相悖，出现负数只能说明该用户不在意该特征指标k，对其他特征指标更在意，所以在选择上可能出现对指标k较低的产品打分也非常高的情况。但为负值则会对推荐精度造成影响，产生过拟合现象，因为用户当面对除k指标，其他特征值都相同的产品时，极大概率更喜欢该特征值高的理财产品，原技术执行系数为负值的操作则进行了不正确的判断。

发明内容

本发明需要且能够解决的技术问题如下：

现有的基于内容的线性推荐方法，当回归方程有些系数出现负数时，表明该产品的对应特征量化值与用户购买该产品的意愿呈现负相关，而对于理财产品来说，其数据特征值与受欢迎程度始终成正比的性质，直接套用现有推荐方法会影响推荐的精度，故本发明设计一种更合理的推荐方案。

本发明具体的技术方案如下：

一种改进的基于内容的线性回归方式理财产品推荐方法，在线获取用户的产品信息表和用户行为记录表后，进行以下步骤：

步骤1.产品信息表A″通过专家属性打分规则A'形成产品-属性打分表A，A中元素X_j ^k表示第j个商品第k个特征的专家量化值；

步骤2.用户行为记录表B″通过专家操作打分规则B'形成用户-产品喜好打分表B，B中元素Y_i ^j表示第i个用户对第j个商品的喜好打分值；

步骤3.设用户-产品分数阈值为β，针对用户i,选择符合条件的用户-商品喜好打分向量Y[Y_i ^a Y_i ^b...Y_i ^c]及对应产品的产品偏好特征属性训练表X，我们通过梯度下降法，学习得到用户i的产品偏好特征属性的参数向量θ_i＝[θ_i ¹θ_i ²...θ_i ⁿ⁺¹]；

步骤4.对于θ_j ^k<0的情况，将θ_j ^k赋值为得到修正后的用户i对产品特征属性偏好的参数向量

步骤5.将步骤1得到的产品特征属性表A和步骤4得到的修正后的用户i-产品特征属性偏好参数向量θ_i'做内积，得到用户i对所有产品的评分Y_i[Y_i ¹,Y_i ²...Y_i ^m]；

步骤6.将Y_i中的分值由大到小进行排序，得到用户i的产品推荐列表Y_i[Y_i ^o,Y_i ^p...Y_i ^q]；

步骤7.以此循环步骤3到步骤6，完成所有用户的推荐列表的生成。本发明的有益效果：

1.现有进行线性回归理财产品推荐时，回归方程有些系数出现负数，表明该特性对用户购买该产品呈负相关，但实际应用场景相悖，产生过拟合现象，本发明能更直接找出错误产生的原因并进行改正，得出更优更符合实际情况的推荐。

2.将θ_j ^k赋值为符合实际情况的自然规律，因为(1)取值范围为(0,0.5)，所取值相对较小，体现了用户对该产品不太重视的现象；(2)且当θ_j ^k越小时，负相关性越大，代表用户越不关心该指标，则越小，代表推荐正相关性越小，符合用户兴趣。

附图说明

图1为基于内容的线性回归理财产品推荐方法的流程图。

具体实施方式：

如图1所示，本发明提供一种改进的基于内容的线性回归理财产品推荐方法，在线获取用户的产品信息表和用户行为记录表后，进行以下步骤：

步骤(1)产品信息表A″通过专家-属性打分规则A'形成产品-属性表A，A中元素X_j ^k表示第j个商品第k个特征的专家量化值

设产品有n维属性信息，共有m种产品，专家给出的属性打分规则为A',其中A'＝[f₁(x₁),f₂(x₂)....f_n(x_n)]，其中f_k(x_k)表示为产品第k个特征的打分规则，信息表为A″，其中A″＝[[x₁ ¹,x₁ ²....x₁ ⁿ],[x₂ ¹,x₂ ²....x₂ ⁿ]...[x_m ¹,x_m ²....x_m ⁿ]]，将A″代入A'得到产品特征属性表A＝[[X₁ ¹,X₁ ²....X₁ ⁿ],[X₂ ¹,X₂ ²....X₂ ⁿ]...[X_m ¹,X_m ²....X_m ⁿ]]，其中X_j ^k＝f_k(x_j ^k)，表示第j个产品的第k个特征信息值，经过专家-属性打分规则，得到的特征量化分数。如针对某理财产品j，其锁定期为0.5～1年，通过专家-属性打分规则，得到该产品的第3个特征值量化得分0.5分。

步骤(2)用户行为记录表B″通过专家-操作打分规则B'形成用户-商品隐式喜好打分表B，B中元素Y_i ^j表示第i个用户对第j个商品的隐式喜好打分值；

设有m种产品，L位用户，d种用户对产品的操作，用户行为记录表为B″，

其中，type∈T[type_a,type_b...type_g],T为操作类型表，type为一种用户的操作类型，如点击浏览，点击关注等，专家给出的操作打分规则为B',其中B'＝[f₁(x₁),f₂(x₂)....f_d(x_d)]，其中f_k(x_k)表示为产品第k种操作类型的打分规则，将B″代入B'得到用户对商品隐式喜好打分表B＝[[Y₁ ¹,Y₁ ²....Y₁ ^m],[Y₂ ¹,Y₂ ²....Y₂ ^m]...[Y_L ¹,X_L ²....X_L ^m]],

其中Y_i ^j＝∑f_z(type_z),type_z∈[user_i,prd_j[type....type]]表示用户i对产品j产生的操作，按照专家-操作打分规则产生的喜好得分。例如用户i对产品j产生的点击，关注等操作，按照专家-操作打分规则,用户i-产品j隐式喜好得分＝点击次数*2+关注*5+购买次数*10＝45分。

步骤(3)设分数阈值为β，针对用户i,选择该用户在第二步中对产品打分值Y_i ^j>β的产品的用户-商品喜好打分向量Y[Y_i ^a Y_i ^b...Y_i ^c](设有M个符合条件的产品)，a,b,c代表各自产品号，则用户i的产品偏好特征属性训练表为X[[X_a ^l,X_a ²...X_a ⁿ，1],[X_b ^l,X_b ²...X_b ⁿ,1]...[X_c ^l,X_c ²...X_c ⁿ,1]]，我们通过梯度下降法，先随机初始化用户i的产品偏好特征属性的参数向量训练步长为α，算法终止距离ε，则此时损失函数为其中j为符合条件的第j个产品，确定当前位置的损失函数的梯度，对于用户i对产品的第k个属性特征其梯度更新表达式如下，其中N已更新的次数，故经过第N次更新后用户i的产品偏好特征属性的参数向量当时，终止更新，此时，设学习得到用户i的产品偏好特征属性的参数向量θ_i＝[θ_i ¹θ_i ²...θ_i ⁿ⁺¹]。

步骤(4)对于θ_j ^k<0的情况，将θ_j ^k赋值为得到修正后的用户i-产品特征属性偏好参数向量

步骤(5)将步骤1得到的产品特征属性表A[[X₁ ^l,X₁ ²...X₁ ⁿ，1],[X₂ ^l,X₂ ²...X₂ ⁿ,1]...[X_m ^l,X_m ²...X_m ⁿ,1]]和步骤4得到的修正后的用户i-产品特征属性偏好参数向量

做内积得到用户i对所有产品的评分Y_i[Y_i ¹,Y_i ²...Y_i ^m]。

步骤(6)将Y_i中的分值由大到小进行排序，得到用户i的产品推荐列表Y_i[Y_i ^o,Y_i ^p...Y_i ^q]。

步骤(7)以此循环步骤3到步骤6，完成所有用户的推荐列表的生成。

Claims

1.一种基于内容的线性回归理财产品推荐方法，其特征在于，在线获取用户的产品信息表和用户行为记录表后，包括以下步骤：

步骤1.产品信息表A”通过专家属性打分规则A'形成产品-属性打分表A，A中元素表示第j个商品第k个特征的专家量化值；

步骤2.用户行为记录表B”通过专家操作打分规则B'形成用户-产品喜好打分表B，B中元素表示第i个用户对第j个商品的隐式喜好打分值；

步骤3.设用户-产品分数阈值为β，针对用户i,选择符合条件的用户-商品喜好打分向量及对应产品的产品偏好特征属性训练表X，我们通过梯度下降法，学习得到用户i的产品偏好特征属性的参数向量

步骤4.对于的情况，将赋值为得到修正后的用户i对产品特征属性偏好的参数向量

步骤5.将步骤1得到的产品特征属性表A和步骤4得到的修正后的用户i-产品特征属性偏好参数向量θ_i'做内积，得到用户i对所有产品的评分

步骤6.将Y_i中的分值由大到小进行排序，得到用户i的产品推荐列表

步骤7.以此循环步骤3到步骤6，完成所有用户的推荐列表的生成。