CN117390257A - 业务推荐方法、装置、设备、存储介质和程序产品 - Google Patents
业务推荐方法、装置、设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN117390257A CN117390257A CN202311094439.0A CN202311094439A CN117390257A CN 117390257 A CN117390257 A CN 117390257A CN 202311094439 A CN202311094439 A CN 202311094439A CN 117390257 A CN117390257 A CN 117390257A
- Authority
- CN
- China
- Prior art keywords
- attribute data
- attribute
- information
- training
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000013145 classification model Methods 0.000 claims abstract description 75
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000009467 reduction Effects 0.000 claims abstract description 21
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims description 153
- 238000004590 computer program Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003631 expected effect Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种业务推荐方法、装置、设备、存储介质和程序产品。该方法包括:获取目标用户的多个第一属性数据,各第一属性数据对应的属性维度不同,利用信息增益函数确定各第一属性数据对应的信息增益值,并根据各第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据,利用主成分分析法对多个第二属性数据进行降维处理,得到多个第三属性数据,将多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的业务类型偏好信息,根据业务类型偏好信息为目标用户推荐金融业务。采用本方法提供的业务推荐方法,能够有效提高业务推荐效率。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种业务推荐方法、装置、设备、存储介质和程序产品。
背景技术
随着社会经济发展的越来越繁荣,银行在经济发展中占据着重要的地位,在银行现有的业务中,对客户进行产品营销占比越来越多。
现有的对客户进行业务营销时,对所有客户推荐的业务都是相同的。
然而通过这种方式对客户营销时,客户很可能对推荐的业务不感兴趣,导致业务推荐的效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高业务推荐效率的业务推荐方法、装置、设备、存储介质和程序产品。
第一方面,本申请提供了一种业务推荐方法,该方法包括:
获取目标用户的多个第一属性数据,各第一属性数据对应的属性维度不同;利用信息增益函数确定各第一属性数据对应的信息增益值,并根据各第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据;利用主成分分析法对多个第二属性数据进行降维处理,得到多个第三属性数据;将多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的业务类型偏好信息;根据业务类型偏好信息为目标用户推荐金融业务。
在其中一个实施例中,获取目标用户的多个第一属性数据,包括:
获取目标用户的多个目标属性信息,其中,各目标属性信息对应的属性维度不同;根据多个目标属性信息查询属性权重表,属性权重表中存储有不同的属性信息与属性权重值的对应关系;根据查询结果得到各目标属性信息对应的属性权重值,并将各目标属性信息对应的属性权重值作为多个第一属性数据。
在其中一个实施例中,分类模型的训练过程包括:
获取训练用户对应的多个第一训练属性数据,各第一训练属性数据对应的属性维度不同;利用信息增益函数确定各第一训练属性数据对应的信息增益值,并根据各第一训练属性数据对应的信息增益值从多个第一训练属性数据中确定多个第二训练属性数据;利用主成分分析法对多个第二训练属性数据进行降维处理,得到多个第三训练属性数据;获取训练用户对应的训练业务类型偏好信息;将多个第三训练属性数据和训练业务类型偏好信息作为训练样本,对初始分类模型进行训练,得到分类模型。
在其中一个实施例中,根据业务类型偏好信息为目标用户推荐金融业务之后,还包括:
若接收到目标用户反馈的目标信息,则对多个第三属性数据进行调整,其中,目标信息用于指示目标用户对所推荐的金融业务不感兴趣;将调整处理后的多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的更新的业务类型偏好信息;根据更新的业务类型偏好信息为目标用户推荐金融业务。
在其中一个实施例中,对多个第三属性数据进行调整,包括:
从多个第三属性数据中确定候选属性数据,其中,候选属性数据对应的属性维度为易发生信息收集错误的属性维度;对候选属性数据进行调整。
在其中一个实施例中,对候选属性数据进行调整,包括:
确定目标用户的相似用户,相似用户为与目标用户相似度达到预设要求的用户,且,相似用户未对推荐的金融业务反馈不感兴趣的信息;根据相似用户的目标属性数据确定调整方向,目标属性数据对应的属性维度与候选属性数据对应的属性维度相同;根据调整方向对候选属性数据进行调整。
在其中一个实施例中,确定目标用户的相似用户,包括:
从与目标用户具有关联关系的好友用户中,确定目标用户预先指定的相似用户。
第二方面,本申请还提供一种业务推荐装置,该装置包括:
第一获取模块,用于获取目标用户的多个第一属性数据,各第一属性数据对应的属性维度不同;
第二获取模块,用于利用信息增益函数确定各第一属性数据对应的信息增益值,并根据各第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据;
第三获取模块,用于利用主成分分析法对多个第二属性数据进行降维处理,得到多个第三属性数据;
用户分类模块,用于将多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的业务类型偏好信息;
业务推荐模块,用于根据业务类型偏好信息为目标用户推荐金融业务。
在其中一个实施例中,该第一获取模块,具体用于:获取目标用户的多个目标属性信息,其中,各目标属性信息对应的属性维度不同;根据多个目标属性信息查询属性权重表,属性权重表中存储有不同的属性信息与属性权重值的对应关系;根据查询结果得到各目标属性信息对应的属性权重值,并将各目标属性信息对应的属性权重值作为多个第一属性数据。
在其中一个实施例中,该分类模型的训练过程包括:获取训练用户对应的多个第一训练属性数据,各第一训练属性数据对应的属性维度不同;利用信息增益函数确定各第一训练属性数据对应的信息增益值,并根据各第一训练属性数据对应的信息增益值从多个第一训练属性数据中确定多个第二训练属性数据;利用主成分分析法对多个第二训练属性数据进行降维处理,得到多个第三训练属性数据;获取训练用户对应的训练业务类型偏好信息;将多个第三训练属性数据和训练业务类型偏好信息作为训练样本,对初始分类模型进行训练,得到分类模型。
在其中一个实施例中,装置还包括调整模块;
该调整模块,用于若接收到目标用户反馈的目标信息,则对多个第三属性数据进行调整,其中,目标信息用于指示目标用户对所推荐的金融业务不感兴趣;
该用户分类模块,还用于将调整处理后的多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的更新的业务类型偏好信息;
该业务推荐模块,还用于根据更新的业务类型偏好信息为目标用户推荐金融业务。
在其中一个实施例中,该调整模块,具体用于:从多个第三属性数据中确定候选属性数据,其中,候选属性数据对应的属性维度为易发生信息收集错误的属性维度;对候选属性数据进行调整。
在其中一个实施例中,该调整模块,具体用于:确定目标用户的相似用户,相似用户为与目标用户相似度达到预设要求的用户,且,相似用户未对推荐的金融业务反馈不感兴趣的信息;根据相似用户的目标属性数据确定调整方向,目标属性数据对应的属性维度与候选属性数据对应的属性维度相同;根据调整方向对候选属性数据进行调整。
在其中一个实施例中,该调整模块,具体用于:从与目标用户具有关联关系的好友用户中,确定目标用户预先指定的相似用户。
第三方面,本申请还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面任一所述的方法。
第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任一所述的方法。
第五方面,本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述第一方面任一所述的方法。
上述业务推荐方法、装置、设备、存储介质和程序产品,在获取到目标用户的多个第一属性数据后,利用信息增益函数确定各第一属性数据对应的信息增益值,信息增益是属性选择的一个重要指标,它表明一个属性能为分类系统带来多少信息,带来的信息越多,说明该属性越重要,相应的信息增益也就越大,因此根据第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据;而多个第二属性数据之间可能存在相关性,增加了问题分析的复杂性,如果对每个第二属性数据单独进行分析时,是孤立的,不能完全利用数据中的信息,因此利用主成分分析法对第二属性数据进行降维处理,得到多个第三属性数据,这样可以在减少需要分析的第二属性数据数量的同时,尽量减少其包含信息的损失,即得到的第三属性数据减少了数据集的维度,同时保留了目标用户尽可能多的属性信息;将得到的多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的业务类型偏好信息,以便根据目标用户的业务类型偏好信息进行金融业务推荐。这样,在得知目标用户的业务类型偏好信息后,进行金融业务推荐时就可以有针对性的进行,因此,能有效提升业务推荐的效率。
附图说明
图1为一个实施例中业务推荐方法的流程示意图;
图2为一个实施例中获取第一属性数据的流程示意图;
图3为一个实施例中分类模型训练步骤的流程示意图;
图4为一个实施例中业务推荐方法的流程示意图;
图5为一个实施例中候选属性调整方法的流程示意图;
图6为一个实施例中候选属性调整方法的流程示意图;
图7为另一个实施例中业务推荐方法的流程示意图;
图8为一个实施例中业务推荐装置的结构框图;
图9为一个实施例中业务推荐装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
随着社会经济发展的越来越繁荣,银行在经济发展中占据着重要的地位,在银行现有的业务中,对客户进行产品营销占比越来越多,产品的营销活动可以面向公司类客户,这类客户金额大、数量相对较少,也可以面向广大零售客户及个体工商户类的小微企业客户,这类客户金额相对较小、数量很多,还可以面向数量相对有限但资金规模大的金融机构同业类客户。银行产品营销多数是通过线下和线上两种方式进行的,其中线下一般是在银行大厅以多类型方式来展示银行产品,而线上则通过微信、银行APP等科技工具向客户展示产品。
现有的对客户进行业务营销时,对所有客户推荐的业务都是相同的,例如,如果银行最近主推某个业务,那么银行会给所有在办理业务的客户都推荐该业务,或者最近新推出的一些业务在进行营销时也会被无差别的推荐给每一位银行客户,亦或是在某个固定区域开展的一些有区域针对性的业务,会推荐给该地区的所有客户。
然而通过这种方式对客户营销时,金融业务与营销是割裂的,客户很可能对推荐的业务不感兴趣,例如,银行业务最新推出一项代保管业务,也就是银行利用自身设施齐全等有利条件设置保险库,为客户代理保管各种贵重物品并收取手续费的业务,将该业务推荐给所有用户时,大部分情况下,只有客户资产十分庞大或者客户想要保管的物品价值很高时才会想要深入了解该业务。因此,对所有客户推荐相同的业务这种营销方式会导致业务推荐的效率较低。
有鉴于此,本申请提供了一种可以有效地提高业务推荐效率的业务推荐方法。本申请实施例提供的业务推荐方法,其执行主体可以是业务推荐装置,该业务推荐装置可以通过软件、硬件或者软硬件结合的方式实现,可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,该计算机设备可以是服务器。下述方法实施例中,均以执行主体是服务器为例来进行说明。
本申请实施例提供了一种业务推荐方法,如图1所示,该方法包括如下步骤:
S101,服务器获取目标用户的多个第一属性数据。
其中,各第一属性数据对应的属性维度不同。
可选的,目标用户是指即将接收到业务推荐的用户,该用户可以是银行系统中的任何一个已经注册的用户,也可以是未注册的用户,或者是在一批客户中筛选出符合某个条件的用户。
在一种可能实现的方式中,第一属性数据是用户属性信息经过预先设定的属性权重表映射后得到的数值数据。
在另一种可能实现的方式中,第一属性数据也可以是将用户属性信息使用序号编码、二进制编码等进行预处理后的数据。序号编码会按照大小关系对类别型特征赋予一个数值ID,例如高表示为3、中表示为2、低表示为1,转换后依然保留了大小关系,二进制编码先用序号编码给每个类别赋予一个类别ID,然后将类别ID对应的二进制编码作为结果,这种方式仅限于结构化数据,即特征在有限选项内取值。
而上述中的用户属性信息通常是字符串形式,属性信息可以包括年龄、性别、年收入、工作单位等,根据实际应用进行设置,本申请实施例不加以限定。
在一种可能实现的方式中,目标用户的属性信息可以基于银行系统中数据库的用户表获取,在用户注册时将用户填写的属性信息保存在数据库中,通过从数据库的表中获取用户属性数据不受地域、银行分支机构等限制,获取方式简单。
在另一种可能实现的方式中,目标用户的属性信息还可以是经过用户行为分析获取到的,例如,通过分析用户某一阶段的消费记录得到用户的消费能力,或者说根据用户是否贷款以及已贷款额度分析用户是否有房等,这种通过行为分析方式获取用户属性信息时同样不受地域、银行分支机构等限制,获取到的数据较为准确。
需要说明的是,用户在注册银行系统的页面填写完个人信息点击注册按钮提交注册时,会出现弹框指引客户阅读服务条款和隐权政策等文件,用户阅读完相关文件并同意银行系统保存、获取用户信息后,才会完成注册,系统才能保存用户的数据,也就是说本申请获取的目标用户的第一属性数据是经过用户授权允许获取的信息和数据。
S102,服务器利用信息增益函数确定第一属性数据对应的信息增益值,并根据第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据。
可选的,信息增益是信息熵与条件熵的差值,信息熵是代表随机变量的复杂度(不确定度),条件熵代表在某一个条件下随机变量的复杂度(不确定度),也就是说信息增益代表了在一个条件下,信息复杂度(不确定性)减少的程度。在机器学习中,信息增益作为特征选择的一个重要指标,它定义为一个特征能够为分类模型带来多少信息,带来的信息越多,说明该特征越重要,相应的信息增益也就越大。
利用信息增益对第一属性数据的数据特征进行提取,将保留信息增益值较大的一部分特征作为第二属性数据,例如,将得出的信息增益值按照从大到小的顺序排序,将前30个数据作为第二属性数据,第二训练属性数据的维度根据实际应用进行设置,本申请实施例不加以限定。
将属性增益较大的第一属性数据作为第二属性数据,此时第二属性数据为分类模型带来的信息较多,即选出了对模型分类能力重要程度比较高的一些特征数据,因此可以使得分类模型对目标用户的业务类型偏好信息预测相对准确,能够有效的提升业务推荐的效率。
S103,服务器利用主成分分析法对多个第二属性数据进行降维处理,得到多个第三属性。
可选的,主成分分析法是一种降维方法,通常通过将数量很多的变量转换为仍包含集合中大部分信息的较少变量,用于降低数据集的维度,同时保留尽可能多的信息。
在本申请实施例中,主成分分析法的方法步骤如下:
第一步,对原始数据进行标准化处理;通常采用线性函数归一化或者零均值归一化方法。此步骤的目的是标准化结构化指标的范围,因为主成分分析方法对于初始变量的方差非常敏感,如果初始变量的范围之间存在较大差异,则会造成很大变差,使用标准化可以将数据转换为可比较的尺度。
第二步,计算相关系数矩阵。
第三步,计算相关系数矩阵的特征值及其对应的特征向量,特征值由大到小排序,并将特征向量组成m个新的指标向量,m为主成分分析的属性数量。
第四步,选择p个主成分,其中,p小于m。
在经过主成分分析法对数据降维后,得到维度较小的数据集,更易于探索和可视化,而且机器学习算法可以更容易和更快地分析数据,进而能有效提高业务推荐的效率。
S104,服务器将多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的业务类型偏好信息。
在本申请实施例中,分类模型是指预先通过机器学习训练得到的一个能够根据某个目标用户的属性数据预测该目标用户的业务类型偏好信息的模型,该模型输入目标用户的属性数据,根据输出确定目标用户的业务类型偏好信息。
在一种可能实现的方式中,分类模型可以基于逻辑回归算法实现,该模型训练速度非常快,模型的可解释性非常好,从属性的权重可以看到不同属性对最后结果的影响。
在一种可能实现的方式中,分类模型可以基于决策树算法实现,决策树是一种非参数的有监督学习方法,能够从一系列由属性和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类问题,该模型对数据不太敏感,无需做数据预处理。
在一种可能实现的方式中,分类模型可以基于支持向量算法实现,该模型有严格的数学理论支持,可解释性强,简化了分类问题,最终决策函数只由少数的支持向量所确定,计算的复杂度取决于支持向量的数目而不是样本空间的维数,在一定程度上避免了“维数灾难”,模型预测时,预测时间与支持向量的个数成正比。
S105,服务器根据业务类型偏好信息为目标用户推荐金融业务。
需要说明的是,目标用于的业务类型偏好信息一般可以可以体现用户的喜好和诉求,一般可以是喜欢小额理财,也可以是喜欢基金或者股票等,本申请对此不做限定。
在一种可能实现的方式中,为目标用户推荐金融业务时可以是服务器通过银行APP等应用软件对注册用户进行推送。
在另一种可能实现的方式中,为目标用户推荐金融业务也可以是当用户在银行营业大厅办理业务时,服务器通过笔记本电脑等设备对银行业务人员进行提示,银行业务人员接收到根据更新的业务类型偏好信息对目标用户进行推荐的提示后,将对应的业务推荐给目标用户。
上述业务推荐方法中,获取目标用户的多个第一属性数据,利用信息增益函数确定各第一属性数据对应的信息增益值,并根据各第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据,而后利用主成分分析法对多个第二属性数据进行降维处理,得到多个第三属性数据,最终将多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的业务类型偏好信息,根据业务类型偏好信息为目标用户推荐金融业务。这样,在得知目标用户的业务类型偏好信息后,进行金融业务推荐时就可以有针对性的进行,因此,能有效提升业务推荐的效率。
在本申请的一个可选的实施例中,如图2所示,获取目标用户的多个第一属性数据,包括以下步骤:
S201,服务器获取目标用户的多个目标属性信息。
其中,各目标属性信息对应的属性维度不同。
可选的,目标属性信息可以包括目标用户的年龄、性别、年收入、工作单位、贷款额度等,根据实际应用进行设置,本申请实施例不加以限定。
在一种可能实现的方式中,目标用户的目标属性信息可以基于银行系统中数据库的用户表获取,在用户注册时将用户填写的属性信息保存在数据库中,通过从数据库的表中获取用户属性数据不受地域、银行分支机构等限制,获取方式简单。
在另一种可能实现的方式中,目标用户的目标属性信息还可以是经过用户行为分析获取的,同样不受地域、银行分支机构等限制,获取到的数据较为准确。
需要说明的是,本申请获取的目标用户第一目标属性信息是经过用户授权允许获取的信息和数据。
S202,服务器根据多个目标属性信息查询属性权重表。
其中,属性权重表中存储有不同的属性信息与属性权重值的对应关系。
需要说明的是,属性权重表是预先制定好的,保存在服务器中,属性权重表样式如表1所示。
表1
S203,服务器根据查询结果得到各目标属性信息对应的属性权重值,并将各目标属性信息对应的属性权重值作为多个第一属性数据。
需要说明的是,属性权重值在(0,1)之间,一个属性特征的不同属性信息对应的属性权重值之和应当等于1,例如,年龄属性特征划分为22岁以下、22-30岁、30-40岁、40岁以上这4个区间,而对应的属性权重值分别为0.1、0.5、0.3、0.2,这四个数值之和是1;再例如,性别分别对应男、女两个属性信息,男对应的权重值为0.6,女对应的权重值为0.4,这两个属性权重值和也是1。
可选的,将目标属性信息对应的属性权重值作为第一属性数据,例如,当目标客户的年龄在40岁以上,则该目标用户年龄一项的第一属性数据为0.2,而目标客户的年龄是在22岁到30岁之间,则该目标客户年龄一项的第一属性数据为0.5。
上述将用户属性信息根据属性权重表映射成对应的权重数值,转化过程方便高效,便于后续特征提取及降维处理,进而可以根据用户属性信息得到用户的业务类型偏好信息,能有效提高业务推荐的效率。
在一个实施例中,如图3所示,本申请实施例中提供的业务推荐方法,还可以通过如下步骤来训练得到一个分类模型:
S301,服务器获取训练用户对应的多个第一训练属性数据,各第一训练属性数据对应的属性维度不同。
需要说明的是,第一训练属性数据是指在分类模型训练过程中作为输入数据的原始数据,是用来训练模型的。
获取训练用户的多个第一训练属性数据包括获取用户的多个训练属性信息,其中,各训练属性信息对应的属性维度不同;根据多个训练属性信息查询属性权重表,属性权重表中存储有不同的属性信息与属性权重值的对应关系;根据查询结果得到各训练属性信息对应的属性权重值,并将各训练属性信息对应的属性权重值作为多个第一训练属性数据。
在一种可能实现的方式中,通过问卷调查的方式,面向银行用户开展调查,将问卷调查表中用户填写的个人属性信息作为训练属性信息,需要注意问卷调查要在不同地区、不同时间段内展开,同时要注意问卷调查表中的标签体系设定要合理,以保证收集到的用户属性信息无偏、全面并且尽可能的均衡。
在另一种可能实现的方式中,通过分析以往业务推荐记录,获取以往业务推荐成功的用户的属性信息作为训练属性信息,需要注意在业务推荐记录查找时要获取不同分支机构、不同区域、不同时间段内的成功案例。
第一训练属性数据的样式如表2所示。
表2
S302,服务器利用信息增益函数确定各第一训练属性数据对应的信息增益值,并根据各第一训练属性数据对应的信息增益值从多个第一训练属性数据中确定多个第二训练属性数据。
可选的,利用信息增益对第一训练属性数据的数据特征进行提取,将保留信息增益值较大的一部分特征作为第二训练属性数据,也就是将得出的信息增益值按照从大到小的顺序排序,例如,可以将第一训练属性数据的前30个数据作为第二训练属性数据,经过特征提取后保留30个第二训练属性数据,数据样式如表3所示。
表3
年龄 | 性别 | 所在地 | 月公积金 | 年收入 | …… | 属性30 | |
客户1 | 0.3 | 0.6 | 0.2 | 0.2 | …… | …… | |
客户2 | 0.5 | 0.4 | 0.8 | 0.4 | …… | …… | |
客户3 | 0.3 | 0.6 | 0.8 | 0.1 | …… | …… | |
客户4 | |||||||
…… |
第二训练属性数据的维度根据实际应用进行设置,本申请实施例不加以限定。
S303,服务器利用主成分分析法对多个第二训练属性数据进行降维处理,得到多个第三训练属性数据。
可选的,利用主成分分析法对第二训练属性数据进行降维处理,最终保留包含信息量更高的属性数据作为第三训练属性数据,用于训练模型,例如,保留20个包含信息量更高的属性数据作为第三训练属性数据,经过降维后得到的第三训练属性数据数据样式如表4所示。
表4
年龄 | 性别 | 是否有房 | 月公积金 | 年收入 | …… | 属性20 | |
客户1 | 0.3 | 0.6 | 0.7 | 0.2 | …… | …… | |
客户2 | 0.5 | 0.4 | 0.3 | 0.4 | …… | …… | |
客户3 | 0.3 | 0.6 | 0.7 | 0.1 | …… | …… | |
客户4 | |||||||
…… |
同样地,第三训练属性数据的维度根据实际应用进行设置,本申请实施例不加以限定。
S304,服务器获取训练用户对应的训练业务类型偏好信息。
可选的,训练业务类型偏好信息一般可以表示训练用户的喜好和诉求,其中,训练业务类型偏好信息应当与第一训练属性相对应,训练业务类型偏好信息的获取方式与上述的第一训练属性数据的获取方式类似。
在一种可能实现的方式中,通过问卷调查的方式获取第一训练属性数据时,将问卷调查中对应用户填写的业务类型偏好信息作为训练业务类型偏好信息。
在另一种可能实现的方式中,获取以往成功进行业务推荐的记录,将记录中具体某一条的用户属性数据作为第一训练属性数据时,需要将用户最终购买的业务类型作为训练业务偏好信息。
S305,服务器将多个第三训练属性数据和训练业务类型偏好信息作为训练样本,对初始分类模型进行训练,得到分类模型。
在一种可能实现的方式中,将训练样本80%的数据用来训练模型,将训练样本20%的数据用来测试模型的正确性,若得到的分类模型未达到预期效果,则调整参数持续优化,最终得出一个正确性较高的模型。
在另一种可能实现的方式中,将训练样本的部分数据作为初始训练集,用初始训练集训练分类模型,若得到的分类模型未达到预期效果,则向初始训练集中加入部分分类模型错误的样本,或者从初始训练集中剔除部分分类模型正确的样本,利用更新后的初始训练集重新训练分类模型,直至分类模型达到预期效果或直至满足训练结束条件。
上述分类模型的训练过程中,获取训练用户的第一训练属性数据,根据各第一训练属性数据对应的信息增益值确定第二训练属性数据,利用主成分分析法对多个第二训练属性数据进行降维处理,得到多个第三训练属性数据,将第三训练属性数据和训练业务类型偏好信息作为训练样本,这样降低了训练样本的维度,同时保留了目标用户尽可能多的属性信息,可以有效降低计算复杂度,对初始分类模型进行训练,提高训练结果的准确性,因此,将用户的属性数据输入到该训练好的分类模型中,可以得到准确的业务类型偏好信息,能有效提高业务推荐的效率。
在一个实施例中,如图4所示,根据业务类型偏好信息为目标用户推荐金融业务后,还包括以下步骤:
S401,服务器若接收到目标用户反馈的目标信息,则对多个第三属性数据进行调整。
其中,目标信息用于指示目标用户对所推荐的金融业务不感兴趣。在模型已经训练完成后,目标用户的第三属性数据作为输入却得到了不准确的输出,此时第三属性数据可能存在错误,需要对其进行调整。
在一种可能实现的方式中,对数据进行调整时,分析在第三属性数据中是否存在容易发生信息收集错误的属性,例如,用户的所在地或者存款这些容易发生变动而用户可能不会及时更新的属性数据,已贷款额度、信用评分等这些用户在注册时容易填写错误或者不想被系统获取到的属性数据。
在另一种可能实现的方式中,对数据进行调整时,可以分析数据有无明显错误,例如,在预设的属性权重表中,年龄在22岁以下对应的权重是0.1,而现在目标客户的年龄为20岁,而作为输入时对应的属性数据为0,或者说目标客户的性别为男,而作为输入的属性数据对应的值为1,这与预制的属性权重表的数据是不符的,需要分析是否在根据多个目标属性信息查询属性权重表时出现了错误。
S402,服务器将调整处理后的多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的更新的业务类型偏好信息。
可选的,分类模型是指预先通过机器学习训练得到的一个能够根据某个目标用户的属性数据预测该目标用户的业务类型偏好信息的模型。
将调整后的数据作为分类模型的输入,得到更新后的业务类型偏好信息。
S403,服务器根据更新的业务类型偏好信息为目标用户推荐金融业务。
在一种可能实现的方式中,为目标用户推荐金融业务可以是服务器根据更新的业务类型偏好信息通过银行APP等应用软件对目标用户进行推送。
在另一种可能实现的方式中,为目标用户推荐金融业务可以是服务器通过笔记本电脑等设备对银行业务人员进行提示,银行业务人员接收到根据更新的业务类型偏好信息对目标用户进行推荐的提示后,将相应业务推荐给目标客户。
上述若接收到目标用户反馈的目标信息,则对多个第三属性数据进行调整,将调整处理后的多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的更新的业务类型偏好信息,根据更新的业务类型偏好信息为目标用户推荐金融业务,即当终端接收到用户对本次推荐不感兴趣的反馈时,及时对第三属性数据进行调整,再基于更新的业务类型偏好信息进行推荐,以提高业务推荐的效率。
在本申请的一个实施例中,如图5所示,对多个第三属性数据进行调整,包括以下步骤:
S501,服务器从多个第三属性数据中确定候选属性数据。
其中,候选属性数据对应的属性维度为易发生信息收集错误的属性维度。
在一种可能实现的方式中,该候选属性数据可以是用户在注册时容易填写错误或者用户不想被系统获取到的属性数据,例如,已贷款额度或者信用评分等属性数据。
在另一种可能实现的方式中,该候选属性数据可以是用户容易发生变更而系统数据库中未及时进行更新的属性数据,例如,用户的所在地或者存款等属性数据。
S502,服务器对候选属性数据进行调整。
在一种可能实现的方式中,对候选属性数据进行调整,可以对目标用户分类模型的输入进行调整。
在另一种可能实现的方式中,对候选属性数据进行调整,可以对目标用户存储在数据库中的属性信息进行修改。
上述对第三属性数据进行调整,可以重新确定目标用户的分类模型输入,先确定候选属性数据再进行调整,这样能降低调整的难度,提高属性数据调整的效率,进而能有效的提高业务推荐的效率。
在本申请一个可选的实施例中,如图6所示,该对候选属性数据进行调整包括以下步骤:
S601,服务器确定目标用户的相似用户。
其中,相似用户为与目标用户相似度达到预设要求的用户,且,相似用户未对推荐的金融业务反馈不感兴趣的信息。
在一种可能实现的方式中,确定目标用户的相似用户包括:从与目标用户具有关联关系的好友用户中,确定目标用户预先指定的相似用户。
在另一种可能实现的方式中,确定目标用户的相似用户包括:从与目标用户购买过同款金融产品的用户中,确定相似用户。
S602,服务器根据相似用户的目标属性数据确定调整方向。
其中,目标属性数据对应的属性维度与候选属性数据对应的属性维度相同。
在一种可能实现的方式中,根据相似用户的目标属性数据确定调整方向,相似用户可以是一个,可以是用相似用户的目标属性数据直接替换目标用户的候选属性数据。
在另一种可能实现的方式中,根据相似用户的目标属性数据确定调整方向,存在多个相似用户,可以用与多个相似用户目标属性数据的平均值替换目标用户的候选属性数据。
S603,服务器根据调整方向对候选属性数据进行调整。
在一种可能实现的方式中,根据调整方向对候选属性数据进行调整,可以是修改分类模型中目标用户的输入。
在另一种可能实现的方式中,根据调整方向对候选属性数据进行调整,也可以是对数据库中存储的目标用户的属性信息进行修改。
上述通过确定目标用户的相似用户,根据相似用户的目标属性数据确定调整方向,根据调整方向对候选属性数据进行调整,对于分类模型来说,调整后的目标用户的输入与相似用户的输入是类似的,而相似用户未反馈不感兴趣的信息,因此分类模型对此次目标用户输出的业务类型偏好信息不会再是目标用户所不感兴趣的,可以有效提高业务推荐的效率。
作为一种可选的实施方式,如图7所示,本申请实施例中提供的业务推荐方法,可包括如下具体步骤:
S701,服务器获取训练用户对应的多个第一训练属性数据。
S702,服务器利用信息增益函数确定各第一训练属性数据对应的信息增益值,并根据各第一训练属性数据对应的信息增益值从多个第一训练属性数据中确定多个第二训练属性数据。
S703,服务器利用主成分分析法对多个第二训练属性数据进行降维处理,得到多个第三训练属性数据。
S704,服务器获取训练用户对应的训练业务类型偏好信息。
S705,服务器将多个第三训练属性数据和训练业务类型偏好信息作为训练样本,对初始分类模型进行训练,得到分类模型。
S706,服务器获取目标用户的多个目标属性信息,根据多个目标属性信息查询属性权重表,根据查询结果得到各目标属性信息对应的属性权重值,并将各目标属性信息对应的属性权重值作为多个第一属性数据。
S707,服务器利用信息增益函数确定第一属性数据对应的信息增益值,并根据第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据。
S708,服务器利用主成分分析法对多个第二属性数据进行降维处理,得到多个第三属性。
S709,服务器将多个第三属性数据输入至分类模型中,根据分类模型的输出确实目标用户的业务类型偏好信息。
S710,服务器根据业务类型偏好信息为目标用户推荐金融业务。
S711,服务器接收到目标用户反馈的目标信息,从多个第三属性数据中确定候选属性数据。
S712,服务器从与目标用户具有关联关系的好友用户中,确定目标用户预先指定的相似用户,根据相似用户的目标属性数据确定调整方向,根据调整方向对候选属性数据进行调整。
S713,服务器将调整处理后的多个第三属性数据输入至分类模型中,根据类模型的输出确定目标用户的更新的业务类型偏好信息。
S714,服务器根据更新的业务类型偏好信息为目标用户推荐金融业务。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的业务推荐方法的业务推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个业务推荐装置实施例中的具体限定可以参见上文中对于业务推荐方法的限定,在此不再赘述。
在一个实施例中,如图8所示,提供了一种业务推荐装置800,包括:第一获取模块801、第二获取模块802、第三获取模块803、用户分类模块804和业务推荐805模块,其中:
第一获取模块801,用于获取目标用户的多个第一属性数据,各第一属性数据对应的属性维度不同。
第二获取模块802,用于利用信息增益函数确定各第一属性数据对应的信息增益值,并根据各第一属性数据对应的信息增益值从多个第一属性数据中确定多个第二属性数据。
第三获取模块803,用于利用主成分分析法对多个第二属性数据进行降维处理,得到多个第三属性数据。
用户分类模块804,用于将多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的业务类型偏好信息。
业务推荐模块805,用于根据业务类型偏好信息为目标用户推荐金融业务。
在其中一个实施例中,该第一获取模块801,具体用于:获取目标用户的多个目标属性信息,其中,各目标属性信息对应的属性维度不同;根据多个目标属性信息查询属性权重表,属性权重表中存储有不同的属性信息与属性权重值的对应关系;根据查询结果得到各目标属性信息对应的属性权重值,并将各目标属性信息对应的属性权重值作为多个第一属性数据。
在其中一个实施例中,该分类模型的训练过程包括:获取训练用户对应的多个第一训练属性数据,各第一训练属性数据对应的属性维度不同;利用信息增益函数确定各第一训练属性数据对应的信息增益值,并根据各第一训练属性数据对应的信息增益值从多个第一训练属性数据中确定多个第二训练属性数据;利用主成分分析法对多个第二训练属性数据进行降维处理,得到多个第三训练属性数据;获取训练用户对应的训练业务类型偏好信息;将多个第三训练属性数据和训练业务类型偏好信息作为训练样本,对初始分类模型进行训练,得到分类模型。
在一个实施例中,如图9所示,上述装置还包括调整模块806。
该调整模块806,用于若接收到目标用户反馈的目标信息,则对多个第三属性数据进行调整,其中,目标信息用于指示目标用户对所推荐的金融业务不感兴趣。
该用户分类模块804,还用于将调整处理后的多个第三属性数据输入至分类模型中,根据分类模型的输出确定目标用户的更新的业务类型偏好信息。
该业务推荐模块805,还用于根据更新的业务类型偏好信息为目标用户推荐金融业务。
在一个实施例中,该调整模块806,具体用于:从多个第三属性数据中确定候选属性数据,其中,候选属性数据对应的属性维度为易发生信息收集错误的属性维度;对候选属性数据进行调整。
在一个实施例中,该调整模块806,具体用于:确定目标用户的相似用户,相似用户为与目标用户相似度达到预设要求的用户,且,相似用户未对推荐的金融业务反馈不感兴趣的信息;根据相似用户的目标属性数据确定调整方向,目标属性数据对应的属性维度与候选属性数据对应的属性维度相同;根据调整方向对候选属性数据进行调整。
在一个实施例中,该调整模块806,具体用于:从与目标用户具有关联关系的好友用户中,确定目标用户预先指定的相似用户。
上述业务推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务推荐方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (11)
1.一种业务推荐方法,其特征在于,所述方法包括:
获取目标用户的多个第一属性数据,各所述第一属性数据对应的属性维度不同;
利用信息增益函数确定各所述第一属性数据对应的信息增益值,并根据各所述第一属性数据对应的信息增益值从所述多个第一属性数据中确定多个第二属性数据;
利用主成分分析法对所述多个第二属性数据进行降维处理,得到多个第三属性数据;
将所述多个第三属性数据输入至分类模型中,根据所述分类模型的输出确定所述目标用户的业务类型偏好信息;
根据所述业务类型偏好信息为所述目标用户推荐金融业务。
2.根据权利要求1所述的方法,其特征在于,所述获取目标用户的多个第一属性数据,包括:
获取所述目标用户的多个目标属性信息,其中,各所述目标属性信息对应的属性维度不同;
根据所述多个目标属性信息查询属性权重表,所述属性权重表中存储有不同的属性信息与属性权重值的对应关系;
根据查询结果得到各所述目标属性信息对应的属性权重值,并将各所述目标属性信息对应的属性权重值作为所述多个第一属性数据。
3.根据权利要求1所述的方法,其特征在于,所述分类模型的训练过程包括:
获取训练用户对应的多个第一训练属性数据,各所述第一训练属性数据对应的属性维度不同;
利用信息增益函数确定各所述第一训练属性数据对应的信息增益值,并根据各所述第一训练属性数据对应的信息增益值从所述多个第一训练属性数据中确定多个第二训练属性数据;
利用主成分分析法对所述多个第二训练属性数据进行降维处理,得到多个第三训练属性数据;
获取所述训练用户对应的训练业务类型偏好信息;
将所述多个第三训练属性数据和所述训练业务类型偏好信息作为训练样本,对初始分类模型进行训练,得到所述分类模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述业务类型偏好信息为所述目标用户推荐金融业务之后,所述方法还包括:
若接收到所述目标用户反馈的目标信息,则对所述多个第三属性数据进行调整,其中,所述目标信息用于指示所述目标用户对所推荐的金融业务不感兴趣;
将调整处理后的多个第三属性数据输入至所述分类模型中,根据所述分类模型的输出确定所述目标用户的更新的业务类型偏好信息;
根据所述更新的业务类型偏好信息为所述目标用户推荐金融业务。
5.根据权利要求4所述的方法,其特征在于,所述对所述多个第三属性数据进行调整,包括:
从所述多个第三属性数据中确定候选属性数据,其中,所述候选属性数据对应的属性维度为易发生信息收集错误的属性维度;
对所述候选属性数据进行调整。
6.根据权利要求5所述的方法,其特征在于,所述对所述候选属性数据进行调整,包括:
确定所述目标用户的相似用户,所述相似用户为与所述目标用户相似度达到预设要求的用户,且,所述相似用户未对推荐的金融业务反馈不感兴趣的信息;
根据所述相似用户的目标属性数据确定调整方向,所述目标属性数据对应的属性维度与所述候选属性数据对应的属性维度相同;
根据所述调整方向对所述候选属性数据进行调整。
7.根据权利要求6所述的方法,其特征在于,所述确定所述目标用户的相似用户,包括:
从与所述目标用户具有关联关系的好友用户中,确定所述目标用户预先指定的所述相似用户。
8.一种业务推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标用户的多个第一属性数据,各所述第一属性数据对应的属性维度不同;
第二获取模块,用于利用信息增益函数确定各所述第一属性数据对应的信息增益值,并根据各所述第一属性数据对应的信息增益值从所述多个第一属性数据中确定多个第二属性数据;
第三获取模块,用于利用主成分分析法对所述多个第二属性数据进行降维处理,得到多个第三属性数据;
用户分类模块,用于将所述多个第三属性数据输入至分类模型中,根据所述分类模型的输出确定所述目标用户的业务类型偏好信息;
业务推荐模块,用于根据所述业务类型偏好信息为所述目标用户推荐金融业务。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311094439.0A CN117390257A (zh) | 2023-08-29 | 2023-08-29 | 业务推荐方法、装置、设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311094439.0A CN117390257A (zh) | 2023-08-29 | 2023-08-29 | 业务推荐方法、装置、设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117390257A true CN117390257A (zh) | 2024-01-12 |
Family
ID=89436192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311094439.0A Pending CN117390257A (zh) | 2023-08-29 | 2023-08-29 | 业务推荐方法、装置、设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117390257A (zh) |
-
2023
- 2023-08-29 CN CN202311094439.0A patent/CN117390257A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kou et al. | Evaluation of clustering algorithms for financial risk analysis using MCDM methods | |
US10410138B2 (en) | System and method for automatic generation of features from datasets for use in an automated machine learning process | |
Miao et al. | Context‐based dynamic pricing with online clustering | |
Kao et al. | A Bayesian latent variable model with classification and regression tree approach for behavior and credit scoring | |
US20210103858A1 (en) | Method and system for model auto-selection using an ensemble of machine learning models | |
US11107109B2 (en) | Method and system for personalizing offers | |
Florez-Lopez | Effects of missing data in credit risk scoring. A comparative analysis of methods to achieve robustness in the absence of sufficient data | |
Bijak et al. | Modelling LGD for unsecured retail loans using Bayesian methods | |
CN112381154A (zh) | 预测用户概率的方法、装置和计算机设备 | |
CN111178949A (zh) | 服务资源匹配参考数据确定方法、装置、设备和存储介质 | |
CN114997916A (zh) | 潜在用户的预测方法、系统、电子设备和存储介质 | |
CN113781139A (zh) | 物品推荐方法、物品推荐装置、设备和介质 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
Saadaoui | A probabilistic clustering method for US interest rate analysis | |
Munro et al. | Latent dirichlet analysis of categorical survey responses | |
Wu et al. | Research on Segmenting E‐Commerce Customer through an Improved K‐Medoids Clustering Algorithm | |
CN115630221A (zh) | 终端应用界面展示数据处理方法、装置及计算机设备 | |
CN115080868A (zh) | 产品推送方法、装置、计算机设备、存储介质和程序产品 | |
Agustyaningrum et al. | Online shopper intention analysis using conventional machine learning and deep neural network classification algorithm | |
CN112991026A (zh) | 一种商品推荐方法、系统、设备及计算机可读存储介质 | |
CN117522519A (zh) | 产品推荐方法、装置、设备、存储介质和程序产品 | |
Urkup et al. | Customer mobility signatures and financial indicators as predictors in product recommendation | |
Kansal et al. | A Comparative Study of Machine Learning Models for House Price Prediction and Analysis in Smart Cities | |
CN116800831A (zh) | 一种业务数据推送方法、装置、存储介质及处理器 | |
CN117390257A (zh) | 业务推荐方法、装置、设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |