CN114049179A - 产品的推荐方法、装置、计算机设备及存储介质 - Google Patents
产品的推荐方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114049179A CN114049179A CN202111436381.4A CN202111436381A CN114049179A CN 114049179 A CN114049179 A CN 114049179A CN 202111436381 A CN202111436381 A CN 202111436381A CN 114049179 A CN114049179 A CN 114049179A
- Authority
- CN
- China
- Prior art keywords
- data
- recommended
- model
- products
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Finance (AREA)
- Probability & Statistics with Applications (AREA)
- Bioethics (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及人工智能技术领域,揭露了一种产品的推荐方法、装置、计算机设备及存储介质,所述方法包括:获取待推荐客户的第一数据;将第一数据输入评分模型,得到对应的得分,将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据;利用所述待推荐客户对应的第一数据、反馈数据和得分,输入第二推荐模型,得到多个第二产品,将多个所述第二产品作为最终推荐产品输出至前端;本申请还涉及区块链技术,所以第一数据存储于区块链中。本申请提高了产品推荐的准确率。
Description
技术领域
本申请涉及人工智能领域,尤其涉及一种产品的推荐方法、装置、计算机设备及存储介质。
背景技术
随着银行业务的发展,产品种类越来越多,各种产品面向的客群和背后的风控逻辑不尽相同。在当前获客成本居高不下的背景下,如何充分利用现有客户资源,提高进件成功率和客户复购率是业务与IT共同面临的挑战。在现有技术中,利用客户数据,利用推荐模型对客户进行产品推荐,当客户进件被拒绝后,客户经理会根据自身积累的经验匹配适合客户的信贷产品,促成客户购买产品。在推进线上化这一大背景下,部分产品实现了客户线上自助申请,客户经理无法在申请被拒后第一时间进行推荐,丧失了最佳的推荐时机。因此,如何提高对客户推荐产品的准确率成为了亟待解决的问题。
发明内容
本申请提供了一种产品的推荐方法、装置、计算机设备及存储介质,以解决现有技术中,产品推荐准确率较低的问题。
为解决上述问题,本申请提供了一种产品的推荐方法,包括:
获取待推荐客户的第一数据;
将所述第一数据输入评分模型,得到待推荐客户对应的得分,所述评分模型基于逻辑回归模型训练得到;
将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,所述第一推荐模型基于随机森林模型训练得到;
将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据;
利用所述待推荐客户对应的第一数据、反馈数据和得分,输入第二推荐模型,得到多个第二产品;
将多个所述第二产品作为最终推荐产品输出至所述前端。
进一步的,所述获取待推荐客户的第一数据包括:
发送验证指令至所述待推荐客户所在前端,接收所述前端针对所述验证指令反馈的信息,并进行校验;
当校验通过时,获取所述待推荐客户的第一数据。
进一步的,在所述获取待推荐客户的第一数据之前,还包括:
获取历史客户数据集;
利用均衡算法对所述历史客户数据集进行均衡处理,得到均衡数据集;
利用均衡数据集,对逻辑回归模型、随机森林模型以及xgboost模型分别进行训练,对应得到所述评分模型、第一推荐模型和第二推荐模型。
进一步的,所述利用均衡算法对所述历史客户数据集进行均衡处理包括:
获取所述历史客户数据集中各数据类型及其对应的文本数据量;
对各所述数据类型对应的文本数据量进行平均值计算,得到平均数据量;
将各数据类型的文本数据量与所述平均数据量进行比较;
若小于所述平均数据量,则将该数据类型对应的文本数据作为待增广的文本数据,并计算该数据类型对应的文本数据量与所述平均数据量的差值,得到增广数量;
基于所述增广数量,采用合成少数类过采样算法或数据增广工具对所述待增广的文本数据进行增广。
进一步的,所述利用均衡数据集,对逻辑回归模型、随机森林模型以及xgboost模型分别进行训练包括:
通过特征选取模型对所述均衡数据集中各数据类型进行特征重要性计算,根据所述特征重要性,提取所述均衡数据集中第一预设比例的数据类型对应的数据,作为第二数据;
利用方差分析对所述第二数据中各数据类型进行显著性计算,并根据所述显著性,提取所述第二数据中第二预设比例的数据类型对应的数据,作为第三数据;
利用第三数据对所述逻辑回归模型、随机森林模型以及xgboost模型分别进行训练。
进一步的,在所述得到待推荐客户对应的得分之后,还包括:
将所述待推荐客户对应的得分与预设数值进行判断;
当所述得分小于所述预设数值时,将发送推荐结束信息至前端。
进一步的,所述将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据包括:
在将多个所述第一产品推送到所述前端的同时,还将发送反馈表至所述前端;
接收所述前端发送的所述待推荐客户填写后的反馈表;
对所述填写后的反馈表进行特征提取,得到反馈数据。
为了解决上述问题,本申请还提供一种产品的推荐装置,所述装置包括:
获取模块,用于获取待推荐客户的第一数据;
评分模块,用于将所述第一数据输入评分模型,得到待推荐客户对应的得分,所述评分模型基于逻辑回归模型训练得到;
第一推荐模块,用于将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,所述第一推荐模型基于随机森林模型训练得到;
第一推送模块,用于将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据;
第二推荐模块,用于利用所述待推荐客户对应的第一数据、反馈数据和得分,输入第二推荐模型,得到多个第二产品;
第二推送模块,用于将多个所述第二产品作为最终推荐产品输出至所述前端。
为了解决上述问题,本申请还提供一种计算机设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的产品的推荐方法。
为了解决上述问题,本申请还提供一种非易失性的计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的产品的推荐方法。
根据本申请实施例提供的一种产品的推荐方法、装置、计算机设备及存储介质,与现有技术相比至少具有以下有益效果:
通过获取待推荐客户的第一数据,首先将所述第一数据输入至评分模型,以得到对应风控评分,实现根据分数来确定是否对待推荐客户进行后续推荐,所述评分模型基于逻辑回归模型训练得到;当待推荐客户的分数满足要求时,将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,来预先判断待推荐客户的喜好等,将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据,利用所述待推荐客户对应的第一数据、反馈数据和风控得分,输入第二推荐模型,得到多个第二产品,将多个所述第二产品作为最终推荐产品输出至前端,以完成产品的推荐,通过两轮推荐并结合客户对第一次推荐的第一产品的反馈的形式,提高了对客户推荐产品的准确率,最终推荐的产品能更贴合客户的需要和喜好。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图做一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的一种产品的推荐方法的流程示意图;
图2为图1中步骤S21的一种具体实施方式的流程图;
图3为本申请一实施例提供的另一种产品的推荐方法的流程示意图;
图4为图3中步骤S12的一种具体实施方式的流程图;
图5为图3中步骤S13的一种具体实施方式的流程图;
图6为本申请一实施例提供的产品的推荐装置的模块示意图;
图7为本申请一实施例的计算机设备的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是是相同的实施例,也不是与其它实施例相互排斥的独立的或备选的实施例。本领域技术人员显式地或隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请提供一种产品的推荐方法。参照图1所示,图1为本申请一实施例提供的一种产品的推荐方法的流程示意图。
在本实施例中,产品的推荐方法包括:
S21、获取待推荐客户的第一数据;
在本申请中,所述待推荐客户的第一数据包括基础数据和隐私数据,所述基础数据包括姓名、年龄、家庭情况、工作情况以及经济情况(不动产、动产和银行账户流水等)等;所述隐私数据包括历史贷款信息和征信信息等。
获取待推荐客户的第一数据的途径有在获取到待推荐客户的姓名后,从数据库中调取对应的第一数据;直接由待推荐客户进行对应填写并上传;在经待推荐客户授权后,从有关金融机构获取待推荐客户对应的征信信息等。
进一步的,如图2所示,所述获取待推荐客户的第一数据包括:
S211、发送验证指令至所述待推荐客户所在前端,接收所述前端针对所述验证指令反馈的信息,并进行校验;
S212、当校验通过时,获取所述待推荐客户的第一数据。
具体的,所述前端为待推荐客户所在前端,在实际中,最开始待推荐客户会在前端填写个人信息,例如姓名、电话号码等初步的个人信息,后端会暂时将发送待推荐客户初步的个人信息的前端与待推荐用户进行绑定,后续与该推荐用户进行交互时,将发送有关信息至对应的前端;后端会在得到客户的验证并许可后,调取与待推荐客户姓名、电话号码对应的隐私信息。
所述验证指令为人脸识别或语音识别等方式,所述待推荐客户进行人脸识别或语音识别等方式即默认对其隐私数据的获取进行了授权。
在收到用户授权后,才获取对应的隐私数据,保证了整个流程的合规性,以及获取到充分的数据,便于后续的处理。
进一步的,如图3所示,在所述获取待推荐客户的第一数据之前,还包括:
S11、获取历史客户数据集;
S12、利用均衡算法对所述历史客户数据集进行均衡处理,得到均衡数据集;
S13、利用均衡数据集,对逻辑回归模型、随机森林模型以及xgboost模型分别进行训练,对应得到所述评分模型、第一推荐模型和第二推荐模型。
具体的,通过获取历史客户数据集,所述历史客户数据集包含了多个历史客户的基础数据和隐私数据、对应的风控评分以及最终选择进件的产品等数据;
由于所述历史客户数据集中多个历史客户的基础数据和隐私数据并不均衡,若利用不均衡的数据来对模型训练,会导致训练得到的模型效果较差,所以在利用历史客户数据集来训练模型之前,还需利用均衡算法来对所述历史客户数据集进行均衡处理,得到均衡数据集;最后利用均衡数据集来对所述逻辑回归模型、随机森林模型以及xgboost模型分别进行训练,以得到对应的评分模型、第一推荐模型和第二推荐模型。
所述均衡算法具体通过识别历史客户数据集中各数据类型的数据量,根据各所述数据类型的数据量确定平均数据量,将各数据类型的数据量与平均数据量一一比较,将小于平均数据量的数据类型对应的数据确定为待增广的文本数据,并计算需要增广的数量,基于增广的数量,可采用合成少数类过采样算法、重采样、数据合成或重加权等方式来进行,从而得到均衡数据集。
逻辑回归模型为一种广义线性回归模型;随机森林是基于bagging框架下的决策树模型,随机森林包含了很多树,每棵树给出分类结果,基于每棵树的分类结果确定最终分类结果;xgboost模型的思想就是不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数,去拟合上次预测的残差。
通过将历史客户数据集进行均衡处理,得到较均衡的均衡数据集,利用均衡数据集训练得到的模型,其泛化效果更好,即得到的模型更优。
再进一步的,如图4所述,所述利用均衡算法对所述历史客户数据集进行均衡处理包括:
S121、获取所述历史客户数据集中各数据类型及其对应的文本数据量;
S122、对各所述数据类型对应的文本数据量进行平均值计算,得到平均数据量;
S123、将各数据类型的文本数据量与所述平均数据量进行比较;
S124、若小于所述平均数据量,则将该数据类型对应的文本数据作为待增广的文本数据,并计算该数据类型对应的文本数据量与所述平均数据量的差值,得到增广数量;
S125、基于所述增广数量,采用合成少数类过采样算法或数据增广工具对所述待增广的文本数据进行增广。
具体的,由于历史客户数据集中含有多种数据类型,例如家庭情况、工作情况以及经济情况等类别的数据,获取各数据类型中含有的文本数据量;计算各数据类型文本数据量的平均值,得到平均数据量,再基于平均数据量确定待增广的文本数据和增广数量;基于所述增广数量,对待增广的文本数据进行增广,以达到平均数据量,实现对文本训练数据集进行均衡处理。
通过合成少数类过采样算法对待增广的文本数据进行增广,合成少数类过采样算法是一种基于最近邻的技术,由欧几里德判断特征空间中的数据点之间的距离。过采样的百分比表示要创建的合成样本的数量,过采样的百分比参数始终是100的倍数。如果过采样的百分比是100,那么对于每个实例,新样本将被创建,因此,少数类实例的数量将增加一倍。
合成少数类过采样算法通过1)对该少数类的所有样本中找到对应的k个近邻,所述近邻可通过欧式距离进行判断;2)从这k个近邻中随机选择一个样本,再生成一个0-1之间的随机数,计算随机选择的样本与该样本的差值,将该差值乘以随机数后,在于该样本相加;重复步骤2)N次,即可合成N个新样本。
还可以采用EDA数据增广工具包来进行数据增广,EDA即简单数据增广技术,通过4种增广操作,即同义词替换、随机插入、随机交换、随机删除;同义词替换即在句子中随机选取n个非停用词。对每个选取的词,用它的随机选取的同义词替换;随机插入即在句子中任意找一个非停用词,随机选一个它的同义词,插入句子中的任意位置。重复n次;随机交换机任意选取句子中的两个词,交换位置。重复n次;随机删除即对于句子中概率为p的每一个词,随机删除。
通过先确定具体需增广的数据类型,随后利用合成少数类过采样算法或EDA数据增广工具包来进行数据增广,实现得到均衡数据集,利于训练得到效果较优的模型。
再进一步的,如图5所示,所述利用均衡数据集,对逻辑回归模型、随机森林模型以及xgboost模型分别进行训练包括:
S131、通过特征选取模型对所述均衡数据集中各数据类型进行特征重要性计算,根据所述特征重要性,提取所述均衡数据集中第一预设比例的数据类型对应的数据,作为第二数据;
S132、利用方差分析对所述第二数据中各数据类型进行显著性计算,并根据所述显著性,提取所述第二数据中第二预设比例的数据类型对应的数据,作为第三数据;
S133、利用第三数据对所述逻辑回归模型、随机森林模型以及xgboost模型分别进行训练。
具体的,通过将均衡数据集中各数据类型对应的数据输入特征选取模型,得到均衡数据集中各数据类型的重要性值,基于各数据类型对应的所述重要性值,提取预设比例的均衡数据集中的数据,或提取前预设个数的数据类型对应的数据,作为第二数据;由于特征选取模型为根据数据类型对模型的重要性进行选取的,所以不同的模型选取得到的第二数据不尽相同,即逻辑回归模型、随机森林模型以及xgboost模型对应的第二数据不同;
再利用方差分析对所述第二数据进行分析计算,通过利用方差分析会输出多个指标,其中一个指标即为显著性,根据显著性值,对所述第二数据中各数据类型进行排序,从中抽取第二预设比例的数据类型对应的数据,作为第三数据;同样的,通过方差分析,对逻辑回归模型、随机森林模型以及xgboost模型分别对应的第二数据进行显著性判断,从而分别得到逻辑回归模型、随机森林模型以及xgboost模型对应的第三数据。
最后可利用第三数据来对所述逻辑回归模型、随机森林模型以及xgboost模型分别进行训练,以对应得到评分模型、第一推荐模型和第二推荐模型,具体的,针对逻辑回归模型、随机森林模型以及xgboost模型利用特征选取模型和方差分析后,可能会得到不同的第三数据;尤其是逻辑回归模型,与随机森林模型和xgboost模型对应的有较大区别,逻辑回归模型训练完毕后,利用待推荐客户的第一数据,进行评分,而随机森林模型和xgboost模型训练后,都有利用第一数据和待推荐客户对应的得分,来对待推荐客户进行产品推荐,所以利用的数据类型存在差异,以及各数据类型的重要性和显著性对于上述各模型存在一定的差异,所以各模型训练时,对应的第三数据不尽相同。
所述特征选取模型可以基于GBDT(Gradient Boosting Decision Tree,梯度提升决策树)训练得到;梯度提升决策树GBDT是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案;方差分析是指,通过分析研究不同来源的变量对总变量的贡献,从而确定各数据类型对评价结果影响力的大小。
通过特征选取模型和方差分析来对均衡数据集中各数据类型进行选取,以提高后续模型利用数据进行处理时的效率,以及输出结果的准确率。
S22、将所述第一数据输入评分模型,得到待推荐客户对应的得分,所述评分模型基于逻辑回归模型训练得到;
具体的,通过将待推荐客户的第一数据输入至评分模型中,得到待推荐客户对应的风控得分,所述评分模型为基于逻辑回归模型训练得到的一种评分卡模型;并根据所述风控得分判断是否还继续对待推荐客户进行产品推荐,若不进行后续产品推荐,则向前端发送推荐结束信息。是否进行后续产品推荐流程,根据所述得分与预设数值的大小判断得出。
进一步的,在所述得到待推荐客户对应的得分之后,还包括:
将所述待推荐客户对应的得分与预设数值进行判断;
当所述得分小于所述预设数值时,将发送推荐结束信息至前端。
具体的,当获取到待推荐客户对应的得分后,还会将其对应的得分与预设数值进行判断,当小于预设数值时,即其风控评分过低,对其销售产品的风险过高,将不会进行后续的推荐流程,并直接向前端发送推荐结束信息;所述推荐结束信息包括其风控得分等信息。
通过设置以预设数值,以筛除得分较低的客户,避免浪费计算资源。
S23、将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,所述第一推荐模型基于随机森林模型训练得到;
具体的,根据第一数据以及对应的得分,输入至第一推荐模型,得到多个第一产品,所述第一推荐模型为一个初步推荐模型,为试探客户客户倾向购入产品的类型以及喜好等。
S24、将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据;
具体的,根据得到多个第一产品,将其发送至待推荐客户所在前端,并接收所述待推荐客户所在前端反馈的反馈数据,所述反馈的反馈数据为待推荐客户根据预设反馈表格填写后得到的数据。且在所述第一产品推送至前端后,可能待推荐客户直接选择第一产品进行购入,就不会收到反馈数据了,同时也不会进行后续流程。当所述待推荐客户拒绝所述第一产品后,可填写所述反馈表并进行反馈。
进一步的,所述将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据包括:
在将多个所述第一产品推送到所述前端的同时,还将发送反馈表至所述前端;
接收所述前端发送的所述待推荐客户填写后的反馈表;
对所述填写后的反馈表进行特征提取,得到反馈数据。
具体的,通过向待推荐客户发送多个第一产品的同时,还附带发送一反馈表,所述反馈表包括待推荐客户对第一产品的意见情况等内容,待推荐客户在收到多个第一产品和反馈表后,若对多个第一产品不满意,并根据反馈表的内容对应填写有关内容后,将反馈表反馈至后端,后端对填写后的反馈表进行特征提取,以得到反馈数据。所述特征提取包括关键词提取以及特定词提取等。
通过反馈表的形式,引导用户填写第二推荐模型所要利用的数据,提高了后续数据处理的效率。
S25、利用所述待推荐客户对应的第一数据、反馈数据和得分,输入第二推荐模型,得到多个第二产品;
根据将待推荐客户对应的第一数据、反馈数据和得分,输入至第二推荐模型,也即断点推荐模型,通过多获取到的反馈数据,更精确得到符合客户需求和喜好的产品,实现对客户精准推荐产品,所述第二推荐模型可基于xgboost模型训练得到。
S26、将多个所述第二产品作为最终推荐产品输出至所述前端。
将多个所述第二产品作为最终推荐产品输出至待推荐客户所在前端,供用户进行挑选,得到的第二产品将更贴近用户实际需求和喜好,实现了对客户精准推荐。
需要强调的是,为了进一步保证数据的私密性和安全性,所述第一数据的所有数据还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
通过获取待推荐客户的第一数据,首先将所述第一数据输入至评分模型,以得到对应风控评分,实现根据分数来确定是否对待推荐客户进行后续推荐,所述评分模型基于逻辑回归模型训练得到;当待推荐客户的分数满足要求时,将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,来预先判断待推荐客户的喜好等,将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据,利用所述待推荐客户对应的第一数据、反馈数据和风控得分,输入第二推荐模型,得到多个第二产品,将多个所述第二产品作为最终推荐产品输出至前端,以完成产品的推荐,通过两轮推荐并结合客户对第一次推荐的第一产品的反馈的形式,提高了对客户推荐产品的准确率,最终推荐的产品能更贴合客户的需要和喜好。
本实施例还提供一种产品的推荐装置,如图6所示,是本申请产品的推荐装置的功能模块图。
本申请所述产品的推荐装置100可以安装于电子设备中。根据实现的功能,所述产品的推荐装置100可以包括获取模块101、评分模块102、第一推荐模块103、第一推送模块104、第二推荐模块105以及第二推送模块106。本申请所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
获取模块101,用于获取待推荐客户的第一数据;
进一步的,所述获取模块101包括指令发送子模块和数据获取子模块;
所述指令发送子模块,用于发送验证指令至所述待推荐客户所在前端,接收所述前端针对所述验证指令反馈的信息,并进行校验;
所述数据获取子模块,用于当校验通过时,获取所述待推荐客户的第一数据。
通过指令发送子模块和数据获取子模块的配合,在收到用户授权后,才获取对应的隐私数据,保证了整个流程的合规性,以及获取到充分的数据,便于后续的处理。
进一步的,所述产品的推荐装置100还包括历史数据获取模块、均衡处理模块和训练模块;
所述历史数据获取模块,用于获取历史客户数据集;
所述均衡处理模块,用于利用均衡算法对所述历史客户数据集进行均衡处理,得到均衡数据集;
所述训练模块,用于利用均衡数据集,对逻辑回归模型、随机森林模型以及xgboost模型分别进行训练,对应得到所述评分模型、第一推荐模型和第二推荐模型。
通过历史数据获取模块、均衡处理模块和训练模块的配合,将历史客户数据集进行均衡处理,得到较均衡的均衡数据集,利用均衡数据集训练得到的模型,其泛化效果更好,即得到的模型更优。
再进一步的,所述均衡处理模块包括类型获取子模块、平均计算子模块、比较子模块、数量计算子模块以及增广子模块;
类型获取子模块,用于获取所述历史客户数据集中各数据类型及其对应的文本数据量;
平均计算子模块,用于对各所述数据类型对应的文本数据量进行平均值计算,得到平均数据量;
比较子模块,用于将各数据类型的文本数据量与所述平均数据量进行比较;
数量计算子模块,用于若小于所述平均数据量,则将该数据类型对应的文本数据作为待增广的文本数据,并计算该数据类型对应的文本数据量与所述平均数据量的差值,得到增广数量;
增广子模块,用于基于所述增广数量,采用合成少数类过采样算法或数据增广工具对所述待增广的文本数据进行增广。
通过类型获取子模块、平均计算子模块、比较子模块、数量计算子模块以及增广子模块的配合,先确定具体需增广的数据类型,随后利用合成少数类过采样算法或EDA数据增广工具包来进行数据增广,实现得到均衡数据集,利于训练得到效果较优的模型。
再进一步的,所述训练模块包括特征重要性计算子模块和特征显著性计算子模块;
特征重要性计算子模块,用于通过特征选取模型对所述均衡数据集中各数据类型进行特征重要性计算,根据所述特征重要性,提取所述均衡数据集中第一预设比例的数据类型对应的数据,作为第二数据;
特征显著性计算子模块,用于利用方差分析对所述第二数据中各数据类型进行显著性计算,并根据所述显著性,提取所述第二数据中第二预设比例的数据类型对应的数据,作为第三数据;
对应训练子模块,用于利用第三数据对所述逻辑回归模型、随机森林模型以及xgboost模型分别进行训练。
通过特征重要性计算子模块、特征显著性计算子模块和对应训练子模块的配合,特征选取模型和方差分析来对均衡数据集中各数据类型进行选取,以提高后续模型利用数据进行处理时的效率,以及输出结果的准确率。
评分模块102,用于将所述第一数据输入评分模型,得到待推荐客户对应的得分,所述评分模型基于逻辑回归模型训练得到;
进一步的,所述产品的推荐装置100还包括阈值判断模块和结束模块;
阈值判断模块,用于将所述待推荐客户对应的得分与预设数值进行判断;
结束模块,用于当所述得分小于所述预设数值时,将发送推荐结束信息至前端。
通过阈值判断模块和结束模块的配合,通过设置以预设数值,以筛除得分较低的客户,避免浪费计算资源。
第一推荐模块103,用于将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,所述第一推荐模型基于随机森林模型训练得到;
第一推送模块104,用于将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据;
进一步的,所述第一推送模块104包括表发送子模块、表接收子模块以及提取子模块;
所述表发送子模块,用于在将多个所述第一产品推送到所述前端的同时,还将发送反馈表至所述前端;
所述表接收子模块,用于接收所述前端发送的所述待推荐客户填写后的反馈表;
所述提取子模块,用于对所述填写后的反馈表进行特征提取,得到反馈数据。
通过表发送子模块、表接收子模块以及提取子模块的配合,通过反馈表的形式,引导用户填写第二推荐模型所要利用的数据,提高了后续数据处理的效率。
第二推荐模块105,用于利用所述待推荐客户对应的第一数据、反馈数据和得分,输入第二推荐模型,得到多个第二产品;
第二推送模块106,用于将多个所述第二产品作为最终推荐产品输出至所述前端。
通过采用上述装置,所述产品的推荐装置100通过获取模块101、评分模块102、第一推荐模块103、第一推送模块104、第二推荐模块105以及第二推送模块106的配合使用,通过获取待推荐客户的第一数据,首先将所述第一数据输入至评分模型,以得到对应风控评分,实现根据分数来确定是否对待推荐客户进行后续推荐,所述评分模型基于逻辑回归模型训练得到;当待推荐客户的分数满足要求时,将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,来预先判断待推荐客户的喜好等,将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据,利用所述待推荐客户对应的第一数据、反馈数据和风控得分,输入第二推荐模型,得到多个第二产品,将多个所述第二产品作为最终推荐产品输出至前端,以完成产品的推荐,通过两轮推荐并结合客户对第一次推荐的第一产品的反馈的形式,提高了对客户推荐产品的准确率,最终推荐的产品能更贴合客户的需要和喜好。
本申请实施例还提供一种计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件41-43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如产品的推荐方法的计算机可读指令等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据,例如运行所述产品的推荐方法的计算机可读指令。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本实施例通过处理器执行存储在存储器的计算机可读指令时实现如上述实施例产品的推荐方法的步骤,通过获取待推荐客户的第一数据,首先将所述第一数据输入至评分模型,以得到对应风控评分,实现根据分数来确定是否对待推荐客户进行后续推荐,所述评分模型基于逻辑回归模型训练得到;当待推荐客户的分数满足要求时,将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,来预先判断待推荐客户的喜好等,将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据,利用所述待推荐客户对应的第一数据、反馈数据和风控得分,输入第二推荐模型,得到多个第二产品,将多个所述第二产品作为最终推荐产品输出至前端,以完成产品的推荐,通过两轮推荐并结合客户对第一次推荐的第一产品的反馈的形式,提高了对客户推荐产品的准确率,最终推荐的产品能更贴合客户的需要和喜好。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的产品的推荐方法的步骤,通过获取待推荐客户的第一数据,首先将所述第一数据输入至评分模型,以得到对应风控评分,实现根据分数来确定是否对待推荐客户进行后续推荐,所述评分模型基于逻辑回归模型训练得到;当待推荐客户的分数满足要求时,将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,来预先判断待推荐客户的喜好等,将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据,利用所述待推荐客户对应的第一数据、反馈数据和风控得分,输入第二推荐模型,得到多个第二产品,将多个所述第二产品作为最终推荐产品输出至前端,以完成产品的推荐,通过两轮推荐并结合客户对第一次推荐的第一产品的反馈的形式,提高了对客户推荐产品的准确率,最终推荐的产品能更贴合客户的需要和喜好。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
本申请上述实施例的产品的推荐装置、计算机设备、计算机可读存储介质具有与上述实施例的产品的推荐方法相同的技术效果,在此不作展开。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种产品的推荐方法,其特征在于,所述方法包括:
获取待推荐客户的第一数据;
将所述第一数据输入评分模型,得到待推荐客户对应的得分,所述评分模型基于逻辑回归模型训练得到;
将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,所述第一推荐模型基于随机森林模型训练得到;
将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据;
利用所述待推荐客户对应的第一数据、反馈数据和得分,输入第二推荐模型,得到多个第二产品;
将多个所述第二产品作为最终推荐产品输出至所述前端。
2.根据权利要求1所述的产品的推荐方法,其特征在于,所述获取待推荐客户的第一数据包括:
发送验证指令至所述待推荐客户所在前端,接收所述前端针对所述验证指令反馈的信息,并进行校验;
当校验通过时,获取所述待推荐客户的第一数据。
3.根据权利要求1所述的产品的推荐方法,其特征在于,在所述获取待推荐客户的第一数据之前,还包括:
获取历史客户数据集;
利用均衡算法对所述历史客户数据集进行均衡处理,得到均衡数据集;
利用均衡数据集,对逻辑回归模型、随机森林模型以及xgboost模型分别进行训练,对应得到所述评分模型、第一推荐模型和第二推荐模型。
4.根据权利要求3所述的产品的推荐方法,其特征在于,所述利用均衡算法对所述历史客户数据集进行均衡处理包括:
获取所述历史客户数据集中各数据类型及其对应的文本数据量;
对各所述数据类型对应的文本数据量进行平均值计算,得到平均数据量;
将各数据类型的文本数据量与所述平均数据量进行比较;
若小于所述平均数据量,则将该数据类型对应的文本数据作为待增广的文本数据,并计算该数据类型对应的文本数据量与所述平均数据量的差值,得到增广数量;
基于所述增广数量,采用合成少数类过采样算法或数据增广工具对所述待增广的文本数据进行增广。
5.根据权利要求3所述的产品的推荐方法,其特征在于,所述利用均衡数据集,对逻辑回归模型、随机森林模型以及xgboost模型分别进行训练包括:
通过特征选取模型对所述均衡数据集中各数据类型进行特征重要性计算,根据所述特征重要性,提取所述均衡数据集中第一预设比例的数据类型对应的数据,作为第二数据;
利用方差分析对所述第二数据中各数据类型进行显著性计算,并根据所述显著性,提取所述第二数据中第二预设比例的数据类型对应的数据,作为第三数据;
利用第三数据对所述逻辑回归模型、随机森林模型以及xgboost模型分别进行训练。
6.根据权利要求1所述的产品的推荐方法,其特征在于,在所述得到待推荐客户对应的得分之后,还包括:
将所述待推荐客户对应的得分与预设数值进行判断;
当所述得分小于所述预设数值时,将发送推荐结束信息至前端。
7.根据权利要求1所述的产品的推荐方法,其特征在于,所述将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据包括:
在将多个所述第一产品推送到所述前端的同时,还将发送反馈表至所述前端;
接收所述前端发送的所述待推荐客户填写后的反馈表;
对所述填写后的反馈表进行特征提取,得到反馈数据。
8.一种产品的推荐装置,其特征在于,所述装置包括:
获取模块,用于获取待推荐客户的第一数据;
评分模块,用于将所述第一数据输入评分模型,得到待推荐客户对应的得分,所述评分模型基于逻辑回归模型训练得到;
第一推荐模块,用于将所述待推荐客户对应的第一数据和得分输入第一推荐模型,得到多个第一产品,所述第一推荐模型基于随机森林模型训练得到;
第一推送模块,用于将多个所述第一产品推送到所述待推荐客户所在前端,当所述待推荐客户拒绝所述第一产品后,接收所述待推荐客户反馈的反馈数据;
第二推荐模块,用于利用所述待推荐客户对应的第一数据、反馈数据和得分,输入第二推荐模型,得到多个第二产品;
第二推送模块,用于将多个所述第二产品作为最终推荐产品输出至所述前端。
9.一种计算机设备,其特征在于,所述计算机设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一所述的产品的推荐方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一所述的产品的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111436381.4A CN114049179A (zh) | 2021-11-29 | 2021-11-29 | 产品的推荐方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111436381.4A CN114049179A (zh) | 2021-11-29 | 2021-11-29 | 产品的推荐方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114049179A true CN114049179A (zh) | 2022-02-15 |
Family
ID=80211750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111436381.4A Pending CN114049179A (zh) | 2021-11-29 | 2021-11-29 | 产品的推荐方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114049179A (zh) |
-
2021
- 2021-11-29 CN CN202111436381.4A patent/CN114049179A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876133B (zh) | 基于业务信息的风险评估处理方法、装置、服务器和介质 | |
CN107730389A (zh) | 电子装置、保险产品推荐方法及计算机可读存储介质 | |
CN109272408A (zh) | 车贷款金融产品智能推荐方法、装置、设备及介质 | |
CN111861768B (zh) | 基于人工智能的业务处理方法、装置、计算机设备及介质 | |
US11531987B2 (en) | User profiling based on transaction data associated with a user | |
CN113093958B (zh) | 数据处理方法、装置和服务器 | |
CN110766275A (zh) | 数据验证方法、装置、计算机设备及存储介质 | |
CN111160745A (zh) | 用户账户数据的处理方法及装置 | |
CN107767152B (zh) | 产品购买倾向分析方法及服务器 | |
CN107818491A (zh) | 电子装置、基于用户上网数据的产品推荐方法及存储介质 | |
CN112529477A (zh) | 信用评估变量筛选方法、装置、计算机设备及存储介质 | |
CN112634017A (zh) | 远程开卡激活方法、装置、电子设备及计算机存储介质 | |
CN115577172A (zh) | 物品推荐方法、装置、设备及介质 | |
US11475019B2 (en) | Contact graph scoring system | |
CN113887214A (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
CN111553685B (zh) | 确定交易路由通道的方法、装置、电子设备和存储介质 | |
CN116402625B (zh) | 客户评估方法、装置、计算机设备及存储介质 | |
CN113011966A (zh) | 基于深度学习的信用评分方法及装置 | |
CN112100491A (zh) | 基于用户数据的信息推荐方法、装置、设备及存储介质 | |
CN117114901A (zh) | 基于人工智能的投保数据处理方法、装置、设备及介质 | |
CN109636627B (zh) | 基于区块链的保险产品管理方法、装置、介质及电子设备 | |
CN116843389A (zh) | 理财室门禁系统、方法和存储介质 | |
CN114049179A (zh) | 产品的推荐方法、装置、计算机设备及存储介质 | |
CN116071150A (zh) | 数据处理方法、银行产品推广、风控系统、服务器及介质 | |
US20230289587A1 (en) | Multi-domain feature enhancement for transfer learning (ftl) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |