CN114817741A - 一种理财产品精准推荐方法及装置 - Google Patents

一种理财产品精准推荐方法及装置 Download PDF

Info

Publication number
CN114817741A
CN114817741A CN202210532087.1A CN202210532087A CN114817741A CN 114817741 A CN114817741 A CN 114817741A CN 202210532087 A CN202210532087 A CN 202210532087A CN 114817741 A CN114817741 A CN 114817741A
Authority
CN
China
Prior art keywords
target user
user
users
financial
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210532087.1A
Other languages
English (en)
Inventor
张恩会
李涛
余静
陈炳就
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210532087.1A priority Critical patent/CN114817741A/zh
Publication of CN114817741A publication Critical patent/CN114817741A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种理财产品精准推荐方法及装置,可应用于金融领域,方法包括:判断目标用户的理财购买记录的数量是否超过预设值;如果是,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。如果否,则查找与目标用户兴趣相似的用户集合;根据用户集合对应的历史理财产品购买数据获得目标用户的理财产品推荐集合。本申请通过将用户进行区分,针对不同类型的用户分别采用KNN聚类分析方法和基于协同过滤的推荐算法向不同用户推荐合适的理财产品,本申请的参数选取更全面,结构化数据和非结构化数据有不同的处理,模型的构建更完善,从而实现了更加精准地面向用户进行个性化推荐的功能。

Description

一种理财产品精准推荐方法及装置
技术领域
本申请属于金融业务中的深度学习技术领域,具体地讲,涉及一种理财产品精准推荐方法及装置。
背景技术
推荐算法是利用用户的一些行为,通过数学算法推测出用户可能的喜好。目前,推荐算法在为商家带来巨大附加收益的同时也提高了用户的满意度,增加了用户黏性。当前,对于理财产品的推荐没有针对客户进行个性化定制,也没有区分新老用户。对于很少或从未购买过理财产品的新用户和经常购买理财产品的老用户的推荐没有进行分区处理,导致推荐不精准,用户体验不佳。
发明内容
本申请提供了一种理财产品精准推荐方法及装置,以至少解决当前对新用户和老用户的产品营销推荐没有进行分区处理以及推荐不精准的问题。
根据本申请的第一个方面,提供了一种理财产品精准推荐方法,包括:
判断目标用户的理财购买记录的数量是否超过预设值;
如果是,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
在一实施例中,理财产品精准推荐方法还包括:
如果目标用户的理财购买记录的数量未超过预设值,则查找与目标用户兴趣相似的用户集合;
根据用户集合对应的历史理财产品购买数据获得目标用户的理财产品推荐集合。
在一实施例中,查找与目标用户兴趣相似的用户集合包括:
获取目标用户购买的理财产品历史数据;
根据目标用户购买的理财产品历史数据过滤掉预存用户集合中与目标用户没有购买理财产品交集的用户获得剩余用户集合;
从剩余用户集合中查找与目标用户兴趣相似的用户集合。
在一实施例中,从剩余用户集合中查找与目标用户兴趣相似的用户集合,包括:
采用Jaccard相似系数计算目标用户与剩余用户集合中所有用户之间的相似度;
将获得的相似度进行排序,选择相似度最高的前若干位用户生成与目标用户兴趣相似的用户集合。
在一实施例中,KNN模型的训练过程包括:
基于历史用户的操作行为和标的物信息分别构建用户操作行为特征和标的物特征;
根据用户操作行为特征和标的物特征构建训练数据集;
将训练数据集添加标签后利用训练数据集对KNN模型进行训练。
在一实施例中,利用训练数据集对KNN模型进行训练,包括:
将目标用户的特征与训练数据集中对应的特征进行比较,获得与目标用户最为相似的前K个历史用户;其中,K为大于等于1的自然数;
确定K个历史用户对应的操作行为和理财产品信息;
根据操作行为和理财产品信息确定推荐的理财产品。
在一实施例中,将目标用户的特征与训练数据集中对应的特征进行比较,包括:
计算目标用户的特征与训练数据集中对应的特征之间的相似距离,并按照相似距离的递增关系进行排序。
根据本申请的另一个方面,还提供了一种理财产品精准推荐装置,包括:
判断单元,用于判断目标用户的理财购买记录的数量是否超过预设值;
理财产品推荐集合生成单元,用于在如果是的情况下,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
在一实施例中,理财产品精准推荐装置还包括:
查找相似用户单元,用于如果目标用户的理财购买记录的数量未超过预设值,则查找与目标用户兴趣相似的用户集合;
理财产品推荐单元,用于根据用户集合对应的历史理财产品购买数据获得目标用户的理财产品推荐集合。
在一实施例中,查找相似用户单元包括:
历史数据获取模块,用于获取目标用户购买的理财产品历史数据;
过滤模块,用于根据目标用户购买的理财产品历史数据过滤掉预存用户集合中与目标用户没有购买理财产品交集的用户获得剩余用户集合;
相似用户查找模块,用于从剩余用户集合中查找与目标用户兴趣相似的用户集合。
在一实施例中,相似用户查找模块包括:
相似度计算模块,用于采用Jaccard相似系数计算目标用户与剩余用户集合中所有用户之间的相似度;
相似度排序模块,用于将获得的相似度进行排序,选择相似度最高的前若干位用户生成与目标用户兴趣相似的用户集合。
在一实施例中,KNN模型的训练过程包括:
基于历史用户的操作行为和标的物信息分别构建用户操作行为特征和标的物特征;
根据用户操作行为特征和标的物特征构建训练数据集;
将训练数据集添加标签后利用训练数据集对KNN模型进行训练。
在一实施例中,利用训练数据集对KNN模型进行训练,包括:
将目标用户的特征与训练数据集中对应的特征进行比较,获得与目标用户最为相似的前K个历史用户;其中,K为大于等于1的自然数;
确定K个历史用户对应的操作行为和理财产品信息;
根据操作行为和理财产品信息确定推荐的理财产品。
在一实施例中,将目标用户的特征与训练数据集中对应的特征进行比较,包括:
计算目标用户的特征与训练数据集中对应的特征之间的相似距离,并按照相似距离的递增关系进行排序。
本申请通过将用户进行区分,针对不同类型的用户分别采用KNN聚类分析方法和基于协同过滤的推荐算法向不同用户推荐合适的理财产品,本申请的参数选取更全面,结构化数据和非结构化数据有不同的处理,模型的构建更完善,从而实现了更加精准地面向用户进行个性化推荐的功能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种理财产品精准推荐方法流程图。
图2为本申请实施例中另一情况下理财产品精准推荐方法流程图。
图3为本申请实施例中第一种推荐原理示意图。
图4为本申请实施例中第二种推荐原理示意图。
图5为本申请实施例中查找与目标用户兴趣相似的用户集合的方法流程图。
图6为本申请实施例中从剩余用户集合中查找与目标用户兴趣相似的用户集合流程图。
图7为本申请实施例中KNN模型的训练过程。
图8为本申请实施例中利用训练数据集对KNN模型进行训练的流程图。
图9为本申请提供的一种理财产品精准推荐装置结构框图。
图10为本申请实施例中另一情况下的理财产品精准推荐装置结构框图。
图11为本申请实施例中查找相似用户单元的结构框图。
图12为本申请实施例中相似用户查找模块的结构框图。
图13为本申请实施例中一种电子设备的具体实施方式。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本申请的实施例可以应用于金融领域,也可以应用于除金融领域外的其他技术领域。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
随着居民生活水平、教育程度逐渐提高,大众理财意识也越来越强,人们愿意把越来越多的资金存入理财产品。但是由于金融机构拥有较多的理财产品,并且,客户往往在耗费大量时间和经历寻找后依然无法精准选择到适合自己的理财产品。在涉及客户理财产品推荐领域,针对理财产品的推荐对象没有区分新老客户,对于很少或从未购买过理财产品的用户无法做到精准推荐,导致用户体验不佳。
基于上述情况,本申请提供了一种理财产品精准推荐方法,如图1所示,包括:
S101:判断目标用户的理财购买记录的数量是否超过预设值;
S102:如果是,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
首先获取目标用户的理财购买记录的数量(对用户理财购买记录的获取、存储、使用、处理等均符合国家法律法规的相关规定),对于有较多购买理财历史记录的用户,基于用户和所购理财产品信息,采用基于内容的推荐算法为客户推荐合适的理财产品,推荐原理示意图如图3所示。而对于没有较多购买理财历史记录的用户,基于用户和所购理财产品信息,采用基于内容的推荐算法为客户推荐合适的理财产品。推荐原理示意图如图4所示。
在一具体实施例中,如果目标用户的理财购买记录的数量超过了一定的预设值则认为是有较多购买理财历史记录的用户。对于有较多购买理财历史记录的用户,获取该用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合,其中,历史操作行为数据选择的指标为:是否购买,记为{B},非结构化数据用字典表示,转化为结构化数据:1-购买,2-不购买。理财特征数据选择:理财产品的周期、理财产品类型、风险等级、年化收益率、起售金额、购买费率、赎回费率、到账时间、购买次数、持有时长、是否收藏关注、评论、是否分享十三个指标,分别记为{A1,A2,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,A13}。其中理财产品类型和风险等级为非结构化数据,根据常见类型记为字典形式,转换为结构化数据,如理财产品类型:1-债券型、2-信托型、3-股票型……,风险等级:1-低风险、2-中风险、3-高风险。
在一实施例中,如图2所示,理财产品精准推荐方法还包括:
S201:如果目标用户的理财购买记录的数量未超过预设值,则查找与目标用户兴趣相似的用户集合。
S202:根据用户集合对应的历史理财产品购买数据获得目标用户的理财产品推荐集合。
在一具体实施例中,对于没有或者购买理财记录较少或理财记录数据难以获得的用户,采用基于协同过滤的推荐算法向用户推荐适合他们的理财产品。
在一实施例中,如图5所示,查找与目标用户兴趣相似的用户集合包括:
S501:获取目标用户购买的理财产品历史数据。
S502:根据目标用户购买的理财产品历史数据过滤掉预存用户集合中与目标用户没有购买理财产品交集的用户获得剩余用户集合。
S503:从剩余用户集合中查找与目标用户兴趣相似的用户集合。
在一具体实施例中,收集用户购买理财产品的历史数据作为训练集合,先将理财产品非结构化数据如用户a1购买的理财产品历史数据,根据理财产品字典匹配,转换为结构化数据集,记为{A1、A2、A3…An},用户a2购买理财产品的历史数据匹配字典记为{A1、A2、A3…Am},以此类推找到用户a3、a4……的理财历史数据。
数据预处理:当数据量较大时,目标待推荐用户与所有用户构建的用户矩阵太大,为之后的相似用户集选择增加不必要的工作量,因此可以先采用物品到用户的反查方式过滤掉没有交集的用户。所谓物品到用户的反查,即通过目标待推荐用户购买过心仪的理财产品去用户集中匹配,将用户集中购买的理财产品完全无交集的用户剔除,从剩余用户集Aj中匹配相似用户。
在一实施例中,从剩余用户集合中查找与目标用户兴趣相似的用户集合,如图6所示,包括:
S601:采用Jaccard相似系数计算目标用户与剩余用户集合中所有用户之间的相似度。
S602:将获得的相似度进行排序,选择相似度最高的前若干位用户生成与目标用户兴趣相似的用户集合。
在一具体实施例中,首先寻找与用户相似度最高的K个用户:
计算目标待推荐用户和相似用户的相似度,找到与待推荐用户相似度最高的K个用户。对于非对称二元属性,属性值取{0,1}的集合,更适合采用Jaccard相似系数计算用户间相似度,并且对于行为相关的度量,Jaccard一般效果最好,因此通过计算用户间Jaccard相关系数找到与用户相似度最高的K个用户:
Jaccard相关系数:用于比较有限样本集之间的相似性与差异性,Jaccard系数值越大,样本相似度越高。
给定两个集合A,B,Jaccard系数定义为A与B交集的大小与A与B并集的大小的比值,定义如下:
Figure BDA0003634000910000071
当集合A,B都为空时,J(A,B)定义为1。
可通过Python定义Jaccard函数计算目标用户Ai与其他用户集Aj的相似度wi,j。计算得到待推荐目标用户与其他用户的相似度数值,降序排列,选取前K个相似度最高的用户,记为用户集SK
在一具体实施例中,在确定了跟目标用户相似度最高的用户集之后,选取相似度最高前K个用户推荐商品:
根据相似度最高的K个用户对应的理财产品购买数据集,去除用户原本已经发生交互的商品,就得到了待推荐理财产品集合。计算待推荐理财产品的优先级,降序排列,将优先级最高的前K个理财产品推荐给目标用户。待推荐理财产品优先级计算公式:
Figure BDA0003634000910000072
其中p(i,u)为对目标用户i来说待推荐理财产品u的优先级,SK为与目标用户相似度最高的前K个用户集,wi,j为目标用户Ai与其他用户集Aj的相似度(其中j∈S(K)),rj,u为用户j的是否理财产品u的字典值。计算出K个用户中待推荐理财产品优先级后,选取前M个推荐给目标用户。
在一实施例中,如图7所示KNN模型的训练过程包括:
S701:基于历史用户的操作行为和标的物信息分别构建用户操作行为特征和标的物特征。
S702:根据用户操作行为特征和标的物特征构建训练数据集。
S703:将训练数据集添加标签后利用训练数据集对KNN模型进行训练。
在一具体实施例中,首先进行前期数据准备工作,具体包括:
基于用户历史行为为用户做推荐,数据来源分为两部分:基于标的物相关信息、用户对标的物的操作行为。
基于标的物的相关信息特征,选择的:理财产品的周期、理财产品类型、风险等级、年化收益率、起售金额、购买费率、赎回费率、到账时间、购买次数、持有时长、是否收藏关注、评论、是否分享十三个指标,分别记为{A1,A2,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,A13}。其中理财产品类型和风险等级为非结构化数据,根据常见类型记为字典形式,转换为结构化数据,如理财产品类型:1-债券型、2-信托型、3-股票型……,风险等级:1-低风险、2-中风险、3-高风险。
用户操作行为特征,选择的指标为:是否购买,记为{B},非结构化数据用字典表示,转化为结构化数据:1-购买,2-不购买。
根据用户甲历史购买过的理财产品数据Ai,结合用户是否购买B,组合{Ai,B}作为训练数据集,采用基于内容的推荐算法中适合的、准确率较高的K近邻算法(简称KNN))训练模型,根据历史数据判断用户甲未购买过的理财产品Aj是否需要推荐给他。
在一实施例中,利用训练数据集对KNN模型进行训练,如图8所示,包括:
S801:将目标用户的特征与训练数据集中对应的特征进行比较,获得与目标用户最为相似的前K个历史用户。其中,K为大于等于1的自然数;
S802:确定K个历史用户对应的操作行为和理财产品信息。
S803:根据操作行为和理财产品信息确定推荐的理财产品。
在一实施例中,将目标用户的特征与训练数据集中对应的特征进行比较,包括:
计算目标用户的特征与训练数据集中对应的特征之间的相似距离,并按照相似距离的递增关系进行排序。
在一具体实施例中,KNN算法的核心思想是将未标记样本的类别,由距离最近的K个邻居投票决定。就是在训练集中数据和标签已知的情况下,输入测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的那个分类。
算法过程为:
①计算待分类数据与各个训练数据间距离;
②按照距离的递增关系进行排序;
③选取距离最小的K个点;
④确定前K个点所在类别的出现频率;
⑤返回前K个点中出现频率最高的类别作为待分类数据的预测分类。
距离的计算方式可以选用欧几里得距离(即为欧氏距离)或者曼哈顿距离:
(x1,y1)和(x2,y2)间的欧氏距离:
Figure BDA0003634000910000091
(x1,y1)和(x2,y2)间的曼哈顿距离:
Figure BDA0003634000910000092
因为指标间数字大小相差不大,没有某个指标权重过大的情况,所以不标准化处理也可以,直接选用两种计算距离的方式都可以。
模型的训练可以直接通过用户的历史数据集和Python中的scikit-learn库中的RadiusNeighborsClassfier类实现(用户的历史数据量越多模型训练越精确),模型训练完毕,可直接输入待分类理财产品数据,计算分类结果:购买或不购买。如果分类结果为购买,则可以将该理财产品进行推荐。
基于同一发明构思,本申请实施例还提供了一种理财产品精准推荐装置,可以用于实现上述实施例中所描述的方法,如下面实施例所述。由于该理财产品精准推荐装置解决问题的原理与理财产品精准推荐方法相似,因此理财产品精准推荐装置的实施可以参见理财产品精准推荐方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
根据本申请的另一个方面,还提供了一种理财产品精准推荐装置,如图9所示,包括:
判断单元901,用于判断目标用户的理财购买记录的数量是否超过预设值;
理财产品推荐集合生成单元902,用于在如果是的情况下,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
在一具体实施例中,在一具体实施例中,如果目标用户的理财购买记录的数量超过了一定的预设值则认为是有较多购买理财历史记录的用户。对于有较多购买理财历史记录的用户,获取该用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合,其中,历史操作行为数据选择的指标为:是否购买,记为{B},非结构化数据用字典表示,转化为结构化数据:1-购买,2-不购买。理财特征数据选择:理财产品的周期、理财产品类型、风险等级、年化收益率、起售金额、购买费率、赎回费率、到账时间、购买次数、持有时长、是否收藏关注、评论、是否分享十三个指标,分别记为{A1,A2,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,A13}。其中理财产品类型和风险等级为非结构化数据,根据常见类型记为字典形式,转换为结构化数据,如理财产品类型:1-债券型、2-信托型、3-股票型……,风险等级:1-低风险、2-中风险、3-高风险。
在一实施例中,如图10所示,理财产品精准推荐装置还包括:
查找相似用户单元1001,用于如果目标用户的理财购买记录的数量未超过预设值,则查找与目标用户兴趣相似的用户集合;
理财产品推荐单元1002,用于根据用户集合对应的历史理财产品购买数据获得目标用户的理财产品推荐集合。
在一具体实施例中,对于没有或者购买理财记录较少或理财记录数据难以获得的用户,采用基于协同过滤的推荐算法向用户推荐适合他们的理财产品。
在一实施例中,如图11所示,查找相似用户单元1001包括:
历史数据获取模块1101,用于获取目标用户购买的理财产品历史数据;
过滤模块1102,用于根据目标用户购买的理财产品历史数据过滤掉预存用户集合中与目标用户没有购买理财产品交集的用户获得剩余用户集合;
相似用户查找模块1103,用于从剩余用户集合中查找与目标用户兴趣相似的用户集合。
在一具体实施例中,收集用户购买理财产品的历史数据作为训练集合,先将理财产品非结构化数据如用户a1购买的理财产品历史数据,根据理财产品字典匹配,转换为结构化数据集,记为{A1、A2、A3…An},用户a2购买理财产品的历史数据匹配字典记为{A1、A2、A3…Am},以此类推找到用户a3、a4……的理财历史数据。
数据预处理:当数据量较大时,目标待推荐用户与所有用户构建的用户矩阵太大,为之后的相似用户集选择增加不必要的工作量,因此可以先采用物品到用户的反查方式过滤掉没有交集的用户。所谓物品到用户的反查,即通过目标待推荐用户购买过心仪的理财产品去用户集中匹配,将用户集中购买的理财产品完全无交集的用户剔除,从剩余用户集Aj中匹配相似用户。
在一实施例中,如图12所示,相似用户查找模块1103包括:
相似度计算模块1201,用于采用Jaccard相似系数计算目标用户与剩余用户集合中所有用户之间的相似度;
相似度排序模块1202,用于将获得的相似度进行排序,选择相似度最高的前若干位用户生成与目标用户兴趣相似的用户集合。
在一具体实施例中,首先寻找与用户相似度最高的K个用户:
计算目标待推荐用户和相似用户的相似度,找到与待推荐用户相似度最高的K个用户。对于非对称二元属性,属性值取{0,1}的集合,更适合采用Jaccard相似系数计算用户间相似度,并且对于行为相关的度量,Jaccard一般效果最好,因此通过计算用户间Jaccard相关系数找到与用户相似度最高的K个用户:
Jaccard相关系数:用于比较有限样本集之间的相似性与差异性,Jaccard系数值越大,样本相似度越高。
给定两个集合A,B,Jaccard系数定义为A与B交集的大小与A与B并集的大小的比值,定义如下:
Figure BDA0003634000910000111
当集合A,B都为空时,J(A,B)定义为1。
可通过Python定义Jaccard函数计算目标用户Ai与其他用户集Aj的相似度wi,j。计算得到待推荐目标用户与其他用户的相似度数值,降序排列,选取前K个相似度最高的用户,记为用户集SK
在一具体实施例中,在确定了跟目标用户相似度最高的用户集之后,选取相似度最高前K个用户推荐商品:
根据相似度最高的K个用户对应的理财产品购买数据集,去除用户原本已经发生交互的商品,就得到了待推荐理财产品集合。计算待推荐理财产品的优先级,降序排列,将优先级最高的前K个理财产品推荐给目标用户。待推荐理财产品优先级计算公式:
Figure BDA0003634000910000112
其中p(i,u)为对目标用户i来说待推荐理财产品u的优先级,SK为与目标用户相似度最高的前K个用户集,wi,j为目标用户Ai与其他用户集Aj的相似度(其中j∈S(K)),rj,u为用户j的是否理财产品u的字典值。计算出K个用户中待推荐理财产品优先级后,选取前M个推荐给目标用户。
在一实施例中,KNN模型的训练过程包括:
基于历史用户的操作行为和标的物信息分别构建用户操作行为特征和标的物特征;
根据用户操作行为特征和标的物特征构建训练数据集;
将训练数据集添加标签后利用训练数据集对KNN模型进行训练。
在一实施例中,利用训练数据集对KNN模型进行训练,包括:
将目标用户的特征与训练数据集中对应的特征进行比较,获得与目标用户最为相似的前K个历史用户;其中,K为大于等于1的自然数;
确定K个历史用户对应的操作行为和理财产品信息;
根据操作行为和理财产品信息确定推荐的理财产品。
在一实施例中,将目标用户的特征与训练数据集中对应的特征进行比较,包括:
计算目标用户的特征与训练数据集中对应的特征之间的相似距离,并按照相似距离的递增关系进行排序。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式,参见图13,所述电子设备具体包括如下内容:
处理器(processor)1301、内存1302、通信接口(Communications Interface)1303、总线1304和非易失性存储器1305;
其中,所述处理器1301、内存1302、通信接口1303通过所述总线1304完成相互间的通信;
所述处理器1301用于调用所述内存1302和非易失性存储器1305中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101:判断目标用户的理财购买记录的数量是否超过预设值;
S102:如果是,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101:判断目标用户的理财购买记录的数量是否超过预设值;
S102:如果是,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。
在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

Claims (10)

1.一种理财产品精准推荐方法,其特征在于,包括:
判断目标用户的理财购买记录的数量是否超过预设值;
如果是,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
2.根据权利要求1所述的理财产品精准推荐方法,其特征在于,还包括:
如果目标用户的理财购买记录的数量未超过预设值,则查找与目标用户兴趣相似的用户集合;
根据所述用户集合对应的历史理财产品购买数据获得目标用户的理财产品推荐集合。
3.根据权利要求2所述的理财产品精准推荐方法,其特征在于,查找与目标用户兴趣相似的用户集合包括:
获取目标用户购买的理财产品历史数据;
根据目标用户购买的理财产品历史数据过滤掉预存用户集合中与目标用户没有购买理财产品交集的用户获得剩余用户集合;
从所述剩余用户集合中查找与目标用户兴趣相似的用户集合。
4.根据权利要求3所述的理财产品精准推荐方法,其特征在于,所述从所述剩余用户集合中查找与目标用户兴趣相似的用户集合,包括:
采用Jaccard相似系数计算目标用户与所述剩余用户集合中所有用户之间的相似度;
将获得的相似度进行排序,选择相似度最高的前若干位用户生成与目标用户兴趣相似的用户集合。
5.根据权利要求1所述的理财产品精准推荐方法,其特征在于,KNN模型的训练过程包括:
基于历史用户的操作行为和标的物信息分别构建用户操作行为特征和标的物特征;
根据所述用户操作行为特征和所述标的物特征构建训练数据集;
将所述训练数据集添加标签后利用所述训练数据集对所述KNN模型进行训练。
6.根据权利要求5所述的理财产品精准推荐方法,其特征在于,所述利用所述训练数据集对所述KNN模型进行训练,包括:
将目标用户的特征与训练数据集中对应的特征进行比较,获得与目标用户最为相似的前K个历史用户;其中,K为大于等于1的自然数;
确定所述K个历史用户对应的操作行为和理财产品信息;
根据操作行为和理财产品信息确定推荐的理财产品。
7.根据权利要求6所述的理财产品精准推荐方法,其特征在于,所述将目标用户的特征与训练数据集中对应的特征进行比较,包括:
计算目标用户的特征与训练数据集中对应的特征之间的相似距离,并按照相似距离的递增关系进行排序。
8.一种理财产品精准推荐装置,其特征在于,包括:
判断单元,用于判断目标用户的理财购买记录的数量是否超过预设值;
理财产品推荐集合生成单元,用于在如果是的情况下,获取目标用户的历史操作行为数据和理财特征数据输入预先训练的KNN模型中获得理财产品推荐集合。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述理财产品精准推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述理财产品精准推荐方法。
CN202210532087.1A 2022-05-09 2022-05-09 一种理财产品精准推荐方法及装置 Pending CN114817741A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210532087.1A CN114817741A (zh) 2022-05-09 2022-05-09 一种理财产品精准推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210532087.1A CN114817741A (zh) 2022-05-09 2022-05-09 一种理财产品精准推荐方法及装置

Publications (1)

Publication Number Publication Date
CN114817741A true CN114817741A (zh) 2022-07-29

Family

ID=82515884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210532087.1A Pending CN114817741A (zh) 2022-05-09 2022-05-09 一种理财产品精准推荐方法及装置

Country Status (1)

Country Link
CN (1) CN114817741A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078359A (zh) * 2023-10-16 2023-11-17 山东大学 基于用户群分类的产品推荐方法、系统、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078359A (zh) * 2023-10-16 2023-11-17 山东大学 基于用户群分类的产品推荐方法、系统、设备及介质
CN117078359B (zh) * 2023-10-16 2024-01-12 山东大学 基于用户群分类的产品推荐方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN106485562B (zh) 一种基于用户历史行为的商品信息推荐方法及系统
CN109492180A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
WO2015034850A2 (en) Feature selection for recommender systems
US20220172258A1 (en) Artificial intelligence-based product design
US20230093756A1 (en) Systems and methods for generating recommendations
CN112801803B (zh) 一种理财产品推荐方法和装置
CN113424207B (zh) 高效地训练可理解模型的系统和方法
CN116561134A (zh) 业务规则处理方法、装置、设备及存储介质
Ranggadara et al. Applying customer loyalty classification with RFM and Naïve Bayes for better decision making
CN111127074B (zh) 一种数据推荐方法
Wei et al. Online shopping behavior analysis for smart business using big data analytics and blockchain security
CN114817741A (zh) 一种理财产品精准推荐方法及装置
Wasilewski et al. Clustering methods for adaptive e-commerce user interfaces
Sharma et al. Recommendation system for movies using improved version of som with hybrid filtering methods
CN112991026A (zh) 一种商品推荐方法、系统、设备及计算机可读存储介质
Pradhan et al. Measuring customer lifetime value: application of analytic hierarchy process in determining relative weights of ‘lrfm’
CN118193806A (zh) 一种目标检索方法、装置、电子设备及存储介质
Khan et al. Session-Based Course Recommendation Frameworks Using Deep Learning.
Chaparala et al. Exploring Collaborative Filtering Methods for Product Recommendations in E-Commerce: A Study Using Amazon and BigBasket Datasets
Tridalestari et al. Consumer Behavior Analysis on Sales Process Model Using Process Discovery Algorithm for the Omnichannel Distribution System
US20230230143A1 (en) Product recommendation system, product recommendation method, and recordingmedium storing product recommendation program
de Sousa Silva et al. Dynamic clustering personalization for recommending long tail items
Gončarovs et al. Using data analytics for continuous improvement of CRM processes: case of financial institution
US20240037586A1 (en) Influence scoring for segment analysis systems and methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination