CN107967627A - 一种基于内容的线性回归理财产品推荐方法 - Google Patents
一种基于内容的线性回归理财产品推荐方法 Download PDFInfo
- Publication number
- CN107967627A CN107967627A CN201711270746.4A CN201711270746A CN107967627A CN 107967627 A CN107967627 A CN 107967627A CN 201711270746 A CN201711270746 A CN 201711270746A CN 107967627 A CN107967627 A CN 107967627A
- Authority
- CN
- China
- Prior art keywords
- product
- user
- attribute
- value
- marking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种改进的基于内容的线性回归方式进行理财产品推荐方法,使用现有基于内容的线性方式进行产品推荐时,在生成的回归方程中有些系数出现负数,表明该特性对用户购买该产品呈负相关,与实际应用场景相悖,产生过拟合现象。采用本发明理财产品推荐方法,能更直接找出错误产生的原因并进行改进,得出更优更符合实际情况的推荐。
Description
技术领域
本发明属于大数据应用技术领域,尤其涉及一种基于内容的线性回归理财产品推荐方法。
背景技术
理财产品推荐方法是根据用户过去喜欢的产品,为用户推荐和他过去喜欢的产品相似的产品。该推荐方法一般包括以下三步:1.产品特征表示:为每个产品抽取出一些特征来表示此产品;2.用户偏好学习:利用一个用户过去喜欢(及不喜欢)的产品的特征数据,来学习出此用户的喜好特征;3.推荐生成:一个用户偏好和产品特征匹配的过程,为此用户推荐一组相关性最大的产品。
现有采用基于内容的线性方式进行产品推荐时,在回归方程求解中,有些系数出现负数,表明该特性对用户购买该产品呈负相关,但针对特定理财推荐的应用场景,理财产品的特征属性和一般商品的推荐不同,专家对理财产品其特征值的量化具有意义,例如产品收益值,产品灵活性,产品预期达成率,所属银行规模。分数越高代表该特性越优良,与群众喜好呈现正相关模式,如灵活性和收益的分值上,灵活性差的分值低,灵活性好的分值高,收益差的分值低,收益好的分值高,结合实际情况,该特性数值化后越高应该越受欢迎,但在训练的结果某些特征k的系数出现负数,从理论结果表示该特征分值越大,用户越不喜欢该产品,与实际情况相悖,出现负数只能说明该用户不在意该特征指标k,对其他特征指标更在意,所以在选择上可能出现对指标k较低的产品打分也非常高的情况。但为负值则会对推荐精度造成影响,产生过拟合现象,因为用户当面对除k指标,其他特征值都相同的产品时,极大概率更喜欢该特征值高的理财产品,原技术执行系数为负值的操作则进行了不正确的判断。
发明内容
本发明需要且能够解决的技术问题如下:
现有的基于内容的线性推荐方法,当回归方程有些系数出现负数时,表明该产品的对应特征量化值与用户购买该产品的意愿呈现负相关,而对于理财产品来说,其数据特征值与受欢迎程度始终成正比的性质,直接套用现有推荐方法会影响推荐的精度,故本发明设计一种更合理的推荐方案。
本发明具体的技术方案如下:
一种改进的基于内容的线性回归方式理财产品推荐方法,在线获取用户的产品信息表和用户行为记录表后,进行以下步骤:
步骤1.产品信息表A″通过专家属性打分规则A'形成产品-属性打分表A,A中元素Xj k表示第j个商品第k个特征的专家量化值;
步骤2.用户行为记录表B″通过专家操作打分规则B'形成用户-产品喜好打分表B,B中元素Yi j表示第i个用户对第j个商品的喜好打分值;
步骤3.设用户-产品分数阈值为β,针对用户i,选择符合条件的用户-商品喜好打分向量Y[Yi a Yi b...Yi c]及对应产品的产品偏好特征属性训练表X,我们通过梯度下降法,学习得到用户i的产品偏好特征属性的参数向量θi=[θi 1θi 2...θi n+1];
步骤4.对于θj k<0的情况,将θj k赋值为得到修正后的用户i对产品特征属性偏好的参数向量
步骤5.将步骤1得到的产品特征属性表A和步骤4得到的修正后的用户i-产品特征属性偏好参数向量θi'做内积,得到用户i对所有产品的评分Yi[Yi 1,Yi 2...Yi m];
步骤6.将Yi中的分值由大到小进行排序,得到用户i的产品推荐列表Yi[Yi o,Yi p...Yi q];
步骤7.以此循环步骤3到步骤6,完成所有用户的推荐列表的生成。本发明的有益效果:
1.现有进行线性回归理财产品推荐时,回归方程有些系数出现负数,表明该特性对用户购买该产品呈负相关,但实际应用场景相悖,产生过拟合现象,本发明能更直接找出错误产生的原因并进行改正,得出更优更符合实际情况的推荐。
2.将θj k赋值为符合实际情况的自然规律,因为(1)取值范围为(0,0.5),所取值相对较小,体现了用户对该产品不太重视的现象;(2)且当θj k越小时,负相关性越大,代表用户越不关心该指标,则越小,代表推荐正相关性越小,符合用户兴趣。
附图说明
图1为基于内容的线性回归理财产品推荐方法的流程图。
具体实施方式:
如图1所示,本发明提供一种改进的基于内容的线性回归理财产品推荐方法,在线 获取用户的产品信息表和用户行为记录表后,进行以下步骤:
步骤(1)产品信息表A″通过专家-属性打分规则A'形成产品-属性表A,A中元素Xj k表示第j个商品第k个特征的专家量化值
设产品有n维属性信息,共有m种产品,专家给出的属性打分规则为A',其中A'=[f1(x1),f2(x2)....fn(xn)],其中fk(xk)表示为产品第k个特征的打分规则,信息表为A″,其中A″=[[x1 1,x1 2....x1 n],[x2 1,x2 2....x2 n]...[xm 1,xm 2....xm n]],将A″代入A'得到产品特征属性表A=[[X1 1,X1 2....X1 n],[X2 1,X2 2....X2 n]...[Xm 1,Xm 2....Xm n]],其中Xj k=fk(xj k),表示第j个产品的第k个特征信息值,经过专家-属性打分规则,得到的特征量化分数。如针对某理财产品j,其锁定期为0.5~1年,通过专家-属性打分规则,得到该产品的第3个特征值量化得分0.5分。
步骤(2)用户行为记录表B″通过专家-操作打分规则B'形成用户-商品隐式喜好打分表B,B中元素Yi j表示第i个用户对第j个商品的隐式喜好打分值;
设有m种产品,L位用户,d种用户对产品的操作,用户行为记录表为B″,
其中,type∈T[typea,typeb...typeg],T为操作类型表,type为一种用户的操作类型,如点击浏览,点击关注等,专家给出的操作打分规则为B',其中B'=[f1(x1),f2(x2)....fd(xd)],其中fk(xk)表示为产品第k种操作类型的打分规则,将B″代入B'得到用户对商品隐式喜好打分表B=[[Y1 1,Y1 2....Y1 m],[Y2 1,Y2 2....Y2 m]...[YL 1,XL 2....XL m]],
其中Yi j=∑fz(typez),typez∈[useri,prdj[type....type]]表示用户i对产品j产生的操作,按照专家-操作打分规则产生的喜好得分。例如用户i对产品j产生的点击,关注等操作,按照专家-操作打分规则,用户i-产品j隐式喜好得分=点击次数*2+关注*5+购买次数*10=45分。
步骤(3)设分数阈值为β,针对用户i,选择该用户在第二步中对产品打分值Yi j>β的产品的用户-商品喜好打分向量Y[Yi a Yi b...Yi c](设有M个符合条件的产品),a,b,c代表各自产品号,则用户i的产品偏好特征属性训练表为X[[Xa l,Xa 2...Xa n,1],[Xb l,Xb 2...Xb n,1]...[Xc l,Xc 2...Xc n,1]],我们通过梯度下降法,先随机初始化用户i的产品偏好特征属性的参数向量训练步长为α,算法终止距离ε,则此时损失函数为其中j为符合条件的第j个产品,确定当前位置的损失函数的梯度,对于用户i对产品的第k个属性特征其梯度更新表达式如下,其中N已更新的次数,故经过第N次更新后用户i的产品偏好特征属性的参数向量当时,终止更新,此时,设学习得到用户i的产品偏好特征属性的参数向量θi=[θi 1θi 2...θi n+1]。
步骤(4)对于θj k<0的情况,将θj k赋值为得到修正后的用户i-产品特征属性偏好参数向量
步骤(5)将步骤1得到的产品特征属性表A[[X1 l,X1 2...X1 n,1],[X2 l,X2 2...X2 n,1]...[Xm l,Xm 2...Xm n,1]]和步骤4得到的修正后的用户i-产品特征属性偏好参数向量
做内积得到用户i对所有产品的评分Yi[Yi 1,Yi 2...Yi m]。
步骤(6)将Yi中的分值由大到小进行排序,得到用户i的产品推荐列表Yi[Yi o,Yi p...Yi q]。
步骤(7)以此循环步骤3到步骤6,完成所有用户的推荐列表的生成。
Claims (1)
1.一种基于内容的线性回归理财产品推荐方法,其特征在于,在线获取用户的产品信息表和用户行为记录表后,包括以下步骤:
步骤1.产品信息表A”通过专家属性打分规则A'形成产品-属性打分表A,A中元素表示第j个商品第k个特征的专家量化值;
步骤2.用户行为记录表B”通过专家操作打分规则B'形成用户-产品喜好打分表B,B中元素表示第i个用户对第j个商品的隐式喜好打分值;
步骤3.设用户-产品分数阈值为β,针对用户i,选择符合条件的用户-商品喜好打分向量及对应产品的产品偏好特征属性训练表X,我们通过梯度下降法,学习得到用户i的产品偏好特征属性的参数向量
步骤4.对于的情况,将赋值为得到修正后的用户i对产品特征属性偏好的参数向量
步骤5.将步骤1得到的产品特征属性表A和步骤4得到的修正后的用户i-产品特征属性偏好参数向量θi'做内积,得到用户i对所有产品的评分
步骤6.将Yi中的分值由大到小进行排序,得到用户i的产品推荐列表
步骤7.以此循环步骤3到步骤6,完成所有用户的推荐列表的生成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711270746.4A CN107967627A (zh) | 2017-12-05 | 2017-12-05 | 一种基于内容的线性回归理财产品推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711270746.4A CN107967627A (zh) | 2017-12-05 | 2017-12-05 | 一种基于内容的线性回归理财产品推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107967627A true CN107967627A (zh) | 2018-04-27 |
Family
ID=61999426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711270746.4A Pending CN107967627A (zh) | 2017-12-05 | 2017-12-05 | 一种基于内容的线性回归理财产品推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107967627A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109801146A (zh) * | 2019-01-18 | 2019-05-24 | 北京工业大学 | 一种基于需求偏好的资源服务推荐方法及系统 |
CN110070340A (zh) * | 2019-04-22 | 2019-07-30 | 北京卡路里信息技术有限公司 | 一种健身管理方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426686A (zh) * | 2011-09-29 | 2012-04-25 | 南京大学 | 一种基于矩阵分解的互联网信息产品推荐方法 |
CN103246672A (zh) * | 2012-02-09 | 2013-08-14 | 中国科学技术大学 | 对用户进行个性化推荐的方法和装置 |
CN104063589A (zh) * | 2014-06-16 | 2014-09-24 | 百度移信网络技术(北京)有限公司 | 一种推荐方法以及系统 |
CN105469263A (zh) * | 2014-09-24 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及装置 |
CN107273438A (zh) * | 2017-05-24 | 2017-10-20 | 深圳大学 | 一种推荐方法、装置、设备及存储介质 |
-
2017
- 2017-12-05 CN CN201711270746.4A patent/CN107967627A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426686A (zh) * | 2011-09-29 | 2012-04-25 | 南京大学 | 一种基于矩阵分解的互联网信息产品推荐方法 |
CN103246672A (zh) * | 2012-02-09 | 2013-08-14 | 中国科学技术大学 | 对用户进行个性化推荐的方法和装置 |
CN104063589A (zh) * | 2014-06-16 | 2014-09-24 | 百度移信网络技术(北京)有限公司 | 一种推荐方法以及系统 |
CN105469263A (zh) * | 2014-09-24 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及装置 |
CN107273438A (zh) * | 2017-05-24 | 2017-10-20 | 深圳大学 | 一种推荐方法、装置、设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109801146A (zh) * | 2019-01-18 | 2019-05-24 | 北京工业大学 | 一种基于需求偏好的资源服务推荐方法及系统 |
CN109801146B (zh) * | 2019-01-18 | 2020-12-29 | 北京工业大学 | 一种基于需求偏好的资源服务推荐方法及系统 |
CN110070340A (zh) * | 2019-04-22 | 2019-07-30 | 北京卡路里信息技术有限公司 | 一种健身管理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804689B (zh) | 面向问答平台的融合用户隐连接关系的标签推荐方法 | |
CN108363804B (zh) | 基于用户聚类的局部模型加权融合Top-N电影推荐方法 | |
Bai et al. | Integrating Fuzzy C-Means and TOPSIS for performance evaluation: An application and comparative analysis | |
Hung et al. | Market segmentation based on hierarchical self-organizing map for markets of multimedia on demand | |
CN109657156A (zh) | 一种基于循环生成对抗网络的个性化推荐方法 | |
CN102968506A (zh) | 一种基于扩展特征向量的个性化协同过滤推荐方法 | |
CN108647251A (zh) | 基于宽深度门循环联合模型的推荐排序方法 | |
CN110110181A (zh) | 一种基于用户风格和场景偏好的服装搭配推荐方法 | |
CN111932336A (zh) | 一种基于长短期兴趣偏好的商品列表推荐方法 | |
CN109471963A (zh) | 一种基于深度强化学习的推荐算法 | |
CN111177538B (zh) | 一种基于无监督权值计算的用户兴趣标签构建方法 | |
CN103377296B (zh) | 一种多指标评价信息的数据挖掘方法 | |
CN104063481A (zh) | 一种基于用户实时兴趣向量的电影个性化推荐方法 | |
CN103971415B (zh) | 一种三维模型构件的在线标注方法 | |
CN107391582A (zh) | 基于上下文本体树计算用户偏好相似度的信息推荐方法 | |
CN107145506A (zh) | 一种改进基于内容的农资商品推荐方法 | |
Aharon et al. | Off-set: one-pass factorization of feature sets for online recommendation in persistent cold start settings | |
CN108053050A (zh) | 点击率预估方法、装置、计算设备及存储介质 | |
Wang | A survey of online advertising click-through rate prediction models | |
CN110334278A (zh) | 一种基于改进深度学习的web服务推荐方法 | |
CN109903138A (zh) | 一种个性化商品推荐方法 | |
CN107967627A (zh) | 一种基于内容的线性回归理财产品推荐方法 | |
CN106202515A (zh) | 一种基于排序学习的移动应用推荐方法及其推荐系统 | |
CN109918162A (zh) | 一种可学习的海量信息高维图形交互式展示方法 | |
CN113688306A (zh) | 一种基于强化学习的推荐策略生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180427 |