CN117593082A - 确定业务推荐目标的方法、装置、计算机设备、存储介质 - Google Patents
确定业务推荐目标的方法、装置、计算机设备、存储介质 Download PDFInfo
- Publication number
- CN117593082A CN117593082A CN202311605599.7A CN202311605599A CN117593082A CN 117593082 A CN117593082 A CN 117593082A CN 202311605599 A CN202311605599 A CN 202311605599A CN 117593082 A CN117593082 A CN 117593082A
- Authority
- CN
- China
- Prior art keywords
- service
- data
- business
- target
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000004044 response Effects 0.000 claims abstract description 58
- 238000007477 logistic regression Methods 0.000 claims abstract description 55
- 238000007781 pre-processing Methods 0.000 claims abstract description 29
- 238000004590 computer program Methods 0.000 claims abstract description 26
- 238000012216 screening Methods 0.000 claims abstract description 20
- 238000001914 filtration Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 12
- 230000006399 behavior Effects 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000006243 chemical reaction Methods 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000003213 activating effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011835 investigation Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Finance (AREA)
- Educational Administration (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及大数据技术领域,特别是涉及一种确定业务推荐目标的方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取批量用户的原始业务关联数据,所述原始业务关联数据与若干待推荐业务相关联;对所述原始业务关联数据进行预处理,筛选出与目标业务相关联的业务关联指标;调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果;基于所述推荐响应预测结果对所述批量用户进行筛选,选取对所述目标业务的推荐行为的响应概率超过预设阈值的目标用户作为所述目标业务的推荐对象。采用本方法能够提高推荐目标选取的准确度,从而提高业务推荐的转化率。
Description
技术领域
本申请涉及大数据技术领域,特别是涉及一种确定业务推荐目标的方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
近年来,我国经济社会发展对增加征信有效供给、提升征信服务水平提出了新要求,金融科技的发展也为进一步提升征信系统服务能力提供了技术支撑。为更好地满足金融机构和社会各界的征信需求,适应金融科技发展趋势,2020年1月17日征信中心对外提供二代征信查询服务。第二代征信系统相比第一代征信,丰富了基本信息和信贷信息内容,提升了信息更新效率。此外,二代个人和企业征信数据收录了全国大部分的自然人和小微企业,且接入机构涵盖了各类金融机构和非金融机构,数据范围覆盖了各类信贷产品。因此,基于客户的征信数据,可以全面地了解客户的基本情况、信用历史等信息,更准确地对客户风险、客户价值等进行评估。
目前而言,行业内普遍将征信数据与其他数据结合,用于信贷审批、预警、催收等环节的风险控制,个别互联网银行会根据征信信息进行授信。然而,通过征信数据进行营销获客的应用较少,导致一些新老客户的流失,从而带来了一定程度的经济损失。
相关技术中,针对客户进行业务营销响应的预测方法通常是以机构内部获得的各类数据为基础,加工出各类的标签指标,例如客户的代发工资情况、客户的贷款申请情况、客户的贷款使用情况、客户的银行卡流水情况等等,基于这些指标来构建模型或者专家评分卡,从而实现对客户营销响应概率的预测。
然而,目前的业务推荐预测方法,存在如下的技术问题。
现有的预测方法依赖于特定平台提供的用户的基本信息,导致业务推荐预测的判断依据较为片面,且部分指标难以提供较为准确的参考价值,导致推荐预测效果较差。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高推荐目标选取的准确度,从而提高业务推荐的转化率的一种确定业务推荐目标的方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种确定业务推荐目标的方法。所述方法包括:
获取批量用户的原始业务关联数据,所述原始业务关联数据与若干待推荐业务相关联;
对所述原始业务关联数据进行预处理,筛选出与目标业务相关联的业务关联指标;
调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果;
基于所述推荐响应预测结果对所述批量用户进行筛选,选取对所述目标业务的推荐行为的响应概率超过预设阈值的目标用户作为所述目标业务的推荐对象。
在其中一个实施例中,所述调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果包括:
对所述业务关联指标进行线性组合,得到所述逻辑回归分析模型的组合变量;
调用所述逻辑回归分析模型的激活函数对所述组合变量进行函数变换,得到所述推荐响应预测结果,所述激活函数为:
式中,t为所述组合变量,S(t)为所述推荐响应预测结果。
在其中一个实施例中,所述调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果之前,还包括:
获取历史业务关联数据,所述历史业务关联数据与待推荐的目标业务相关联;
基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集;
基于业务标签数据集对所述逻辑回归分析模型进行迭代训练,确定所述逻辑回归分析模型中对应不同所述业务关联指标的特征权重系数。
在其中一个实施例中,所述基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集之后,还包括:
对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型。
在其中一个实施例中,所述对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型包括:
获取不同的所述业务关联指标对样本用户的覆盖率,基于所述覆盖率对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设覆盖率阈值的所述业务关联指标;
和/或;
获取所述业务关联标签的信息值,基于所述信息值对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设重要度阈值的所述业务关联指标;
和/或;
获取随机组合的任意两个所述业务关联标签的相关性参数,基于所述相关性参数对所述业务标签数据集进行过滤,以对相关性参数高于预设的相关性阈值的所述业务关联指标进行择一保留。
在其中一个实施例中,所述基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集包括:
对所述原始业务关联数据进行预处理,所述预处理包括透传处理、交叉比对分析以及统计聚合处理。
第二方面,本申请还提供了一种确定业务推荐目标的装置。所述装置包括:
原始业务数据模块,用于获取批量用户的原始业务关联数据,所述原始业务关联数据与若干待推荐业务相关联;
业务数据预处理模块,用于对所述原始业务关联数据进行预处理,筛选出与目标业务相关联的业务关联指标;
分析模型预测模块,用于调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果;
推荐对象选取模块,用于基于所述推荐响应预测结果对所述批量用户进行筛选,选取对所述目标业务的推荐行为的响应概率超过预设阈值的目标用户作为所述目标业务的推荐对象。
在其中一个实施例中,所述分析模型预测模块包括:
组合变量模块,用于对所述业务关联指标进行线性组合,得到所述逻辑回归分析模型的组合变量;
激活函数模块,用于调用所述逻辑回归分析模型的激活函数对所述组合变量进行函数变换,得到所述推荐响应预测结果,所述激活函数为:
式中,t为所述组合变量,S(t)为所述推荐响应预测结果。
在其中一个实施例中,所述分析模型预测模块之前,还包括:
历史业务数据模块,用于获取历史业务关联数据,所述历史业务关联数据与待推荐的目标业务相关联;
数据标签模块,用于基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集;
模型迭代训练模块,用于基于业务标签数据集对所述逻辑回归分析模型进行迭代训练,确定所述逻辑回归分析模型中对应不同所述业务关联指标的特征权重系数。
在其中一个实施例中,所述数据标签模块之后,还包括:
业务数据过滤模块,用于对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型。
在其中一个实施例中,所述业务数据过滤模块包括:
覆盖率过滤模块,用于获取不同的所述业务关联指标对样本用户的覆盖率,基于所述覆盖率对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设覆盖率阈值的所述业务关联指标;
和/或;
重要度过滤模块,用于获取所述业务关联标签的信息值,基于所述信息值对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设重要度阈值的所述业务关联指标;
和/或;
相关性过滤模块,用于获取随机组合的任意两个所述业务关联标签的相关性参数,基于所述相关性参数对所述业务标签数据集进行过滤,以对相关性参数高于预设的相关性阈值的所述业务关联指标进行择一保留。
在其中一个实施例中,所述数据标签模块包括:
原始数据预处理模块,用于对所述原始业务关联数据进行预处理,所述预处理包括透传处理、交叉比对分析以及统计聚合处理。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任意一项实施例所述的一种确定业务推荐目标的方法中的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面中任意一项实施例所述的一种确定业务推荐目标的方法中的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面中任意一项实施例所述的一种确定业务推荐目标的方法中的步骤。
上述一种确定业务推荐目标的方法、装置、计算机设备、存储介质和计算机程序产品,通过独权中的技术特征进行推导,能够达到对应背景技术中的技术问题的如下有益效果:
在确定业务推荐目标的处理中,首先获取批量用户的原始业务关联数据,通过对原始业务关联数据的预处理筛选出与待推荐的目标业务相关联的业务关联指标。筛选出业务关联指标后,可以调用预构建的逻辑回归分析模型对业务关联指标进行预测处理,通过不同用户的业务关联指标预测得到不同用户对目标业务的推荐响应预测结果。最后根据推荐响应预测结果,在批量用户中筛选出对目标业务的推荐行为的响应概率拆过预设阈值的目标用户作为目标业务的推荐对象。在实施中,有助于通过在大量的原始业务关联数据中进行筛选以及预处理等方式,获取与目标业务关联度较高的业务关联数据,并借助逻辑回归分析模型实现推荐响应预测结果,一方面能够通过业务关联数据扩大对批量用户进行分析的数据来源,从而提高了激活潜在用户的可能性,另一方面有助于借助业务数据对用户的准入条件进行预筛选,有助于提高目标业务的转化成功率。
附图说明
图1为一个实施例中一种确定业务推荐目标的方法的第一流程示意图;
图2为另一个实施例中一种确定业务推荐目标的方法的第二流程示意图;
图3为另一个实施例中一种确定业务推荐目标的方法的第三流程示意图;
图4为另一个实施例中一种确定业务推荐目标的方法的第四流程示意图;
图5为另一个实施例中一种确定业务推荐目标的方法的第五流程示意图;
图6为另一个实施例中一种确定业务推荐目标的方法的第六流程示意图;
图7为一个实施例中一种确定业务推荐目标的装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
相关技术中,针对客户进行业务营销响应的预测方法通常是以机构内部获得的各类数据为基础,加工出各类的标签指标,例如客户的代发工资情况、客户的贷款申请情况、客户的贷款使用情况、客户的银行卡流水情况等等,基于这些指标来构建模型或者专家评分卡,从而实现对客户营销响应概率的预测。
然而,目前的业务推荐预测方法,存在如下的技术问题。
现有的预测方法依赖于特定平台提供的用户的基本信息,导致业务推荐预测的判断依据较为片面,且部分指标难以提供较为准确的参考价值,导致推荐预测效果较差。
基于此,本申请实施例提供的一种确定业务推荐目标的方法。
在一个实施例中,如图1所示,提供了一种确定业务推荐目标的方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤102:获取批量用户的原始业务关联数据,所述原始业务关联数据与若干待推荐业务相关联。
其中,原始业务关联数据可以指以用户为单位的,与多种平台业务相关联的数据,在本申请以信贷业务为背景的应用中,原始业务关联数据可以指用户基本信息、个人征信数据、信贷记录明细等。
示例性地,终端可以在获取充分的授权和许可的前提下,获取批量用户的原始业务关联数据。
步骤104:对所述原始业务关联数据进行预处理,筛选出与目标业务相关联的业务关联指标。
其中,业务关联指标可以指与特定的某一个或多个目标业务存在较强相关性的业务指标。
示例性地,在获取原始业务关联数据后,终端可以对原始业务关联数据进行预处理,从而筛选出与目标业务相关联的业务关联指标。
步骤106:调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果。
其中,逻辑回归分析模型可以指能够用于解决二分类问题的特殊模型,能够输出对应不同结果的概率值。推荐响应预测结果可以指用户对目标业务的推荐行为的响应情况,可以为正向反应以及对应的概率值,以及负向反应及其对应的概率值。
示例性地,终端可以调用预先构建并训练完成的逻辑回归分析模型对业务关联指标进行预测处理,从而得到批量用户对目标业务的推荐响应预测结果。
步骤108:基于所述推荐响应预测结果对所述批量用户进行筛选,选取对所述目标业务的推荐行为的响应概率超过预设阈值的目标用户作为所述目标业务的推荐对象。
示例性地,在获取不同用户的推荐响应预测结果后,终端可以根据推荐响应预测结果对批量用户进行筛选,从而选取出对目标业务的推荐行为的响应概率超过预设阈值的目标用户作为目标业务的推荐对象。
上述一种确定业务推荐目标的方法中,结合实施例中的技术特征进行合理推导,能够实现解决背景技术中所提出的技术问题的有益效果:
在确定业务推荐目标的处理中,首先获取批量用户的原始业务关联数据,通过对原始业务关联数据的预处理筛选出与待推荐的目标业务相关联的业务关联指标。筛选出业务关联指标后,可以调用预构建的逻辑回归分析模型对业务关联指标进行预测处理,通过不同用户的业务关联指标预测得到不同用户对目标业务的推荐响应预测结果。最后根据推荐响应预测结果,在批量用户中筛选出对目标业务的推荐行为的响应概率拆过预设阈值的目标用户作为目标业务的推荐对象。在实施中,有助于通过在大量的原始业务关联数据中进行筛选以及预处理等方式,获取与目标业务关联度较高的业务关联数据,并借助逻辑回归分析模型实现推荐响应预测结果,一方面能够通过业务关联数据扩大对批量用户进行分析的数据来源,从而提高了激活潜在用户的可能性,另一方面有助于借助业务数据对用户的准入条件进行预筛选,有助于提高目标业务的转化成功率。
在一个实施例中,如图2所示,步骤106包括:
步骤202:对所述业务关联指标进行线性组合,得到所述逻辑回归分析模型的组合变量。
示例性地,终端可以对业务关联指标进行线性组合,从而得到用于输入逻辑回归分析模型的组合变量。例如:不同的业务关联指标包括X1、X2、X3等,终端可以分别对每个业务关联指标赋予特征系数,从而得到组合变量aX1+bX2+cX3。
步骤204:调用所述逻辑回归分析模型的激活函数对所述组合变量进行函数变换,得到所述推荐响应预测结果。
示例性地,终端可以调用逻辑回归分析模型的激活函数对组合变量进行函数变换,从而得到推荐响应预测结果。其中,激活函数为:
式中,t为所述组合变量,S(t)为所述推荐响应预测结果。终端可以通过激活函数将组合变量ax+b对应到一个隐状态p,得到p=S(ax+b),然后根据p与1-p的大小决定因变量的值。相应的,将激活函数中的t变换为ax+b,可以得到逻辑回归分析模型的参数形式:
这样,通过激活函数的作用,能够将输出的值限制在区间[0,1]上,p(x)则可以用来表示概率p(y=1|x),即当一个x发生时,y被分到1那一组的概率。
本实施例中,通过激活函数实现的函数变换确定响应概率的预测结果,能够提高预测准确度。
在一个实施例中,如图3所示,步骤106包括:
步骤302:获取历史业务关联数据,所述历史业务关联数据与待推荐的目标业务相关联。
示例性地,终端可以获取历史业务关联数据,所述历史业务关联数据与待推荐的目标业务相关联。
步骤304:基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集。
其中,关系型数据处理流程可以包括数据收集、数据清洗、数据转换、特征工程、数据分析、数据建模等。
示例性地,终端可以基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集。
步骤306:基于业务标签数据集对所述逻辑回归分析模型进行迭代训练,确定所述逻辑回归分析模型中对应不同所述业务关联指标的特征权重系数。
示例性地,终端可以基于业务标签数据集对所述逻辑回归分析模型进行迭代训练,从而确定所述逻辑回归分析模型中对应不同所述业务关联指标的特征权重系数。
本实施例中,基于历史业务关联数据训练得到逻辑回归分析模型,能够提高逻辑回归分析模型中的特征系数与业务推荐响应的关联度,从而提高模型的预测准确度。
在一个实施例中,如图4所示,步骤304之后还包括:
步骤402:对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型。
示例性地,终端可以对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型。
本实施例中,在训练模型之前,对业务标签数据集中的业务关联指标进行过滤处理,能够使得逻辑回归分析模型中的特征参数与业务预测的关联度提高,从而提高逻辑回归分析模型的输出准确度。
在一个实施例中,如图5所示,步骤402包括:
步骤502:获取不同的所述业务关联指标对样本用户的覆盖率,基于所述覆盖率对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设覆盖率阈值的所述业务关联指标。
其中,覆盖率可以指业务关联指标在不同用户在的存在情况,当用户缺失相关数据时,即为当前业务关联指标未覆盖。
示例性地,终端可以获取不同的所述业务关联指标对样本用户的覆盖率,基于所述覆盖率对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设覆盖率阈值的所述业务关联指标。
和/或步骤504:获取所述业务关联标签的信息值,基于所述信息值对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设重要度阈值的所述业务关联指标。
其中,信息值(Information Value,IV)是一种用于评估分类变量对目标变量的预测能力的指标。在建立预测模型时,特别是在信用评分、风险评估等领域,信息值常被用来评估变量的重要性和对目标变量的影响程度。
信息值的计算基于变量的分箱(binning)操作,将分类变量进行分组,然后计算每个分组内的正例(目标变量为正类的样本)和负例(目标变量为负类的样本)的比例,以及正例和负例的比值(WoE,Weight ofEvidence)。
信息值的取值范围通常是0到正无穷,信息值越大表示变量对目标变量的影响越大。通常的判断标准是:小于0.02表示变量对目标变量的预测能力较弱,0.02到0.1表示中等预测能力,大于0.1表示较强的预测能力。
示例性地,终端可以获取所述业务关联标签的信息值,基于所述信息值对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设重要度阈值的所述业务关联指标。
和/或步骤506:获取随机组合的任意两个所述业务关联标签的相关性参数,基于所述相关性参数对所述业务标签数据集进行过滤,以对相关性参数高于预设的相关性阈值的所述业务关联指标进行择一保留。
其中,相关系数可以指一种用来衡量两个变量之间线性关系强度和方向的统计指标。常用的相关系数有皮尔逊相关系数、斯皮尔曼相关系数和肯德尔相关系数等。
示例性地,终端可以获取随机组合的任意两个所述业务关联标签的相关性参数,基于所述相关性参数对所述业务标签数据集进行过滤,以对相关性参数高于预设的相关性阈值的所述业务关联指标进行择一保留。
本实施例中,通过分别从覆盖率、重要度以及相关度三个方面对业务标签数据集进行过滤,有助于提高最终选取用于训练逻辑回归分析模型的数据的有效性。
在一个实施例中,如图6所示,步骤304包括:
步骤602:对所述原始业务关联数据进行预处理,所述预处理包括透传处理、交叉比对分析以及统计聚合处理。
其中,透传是指直接使用原始数据,或进行简单处理的加工标签方法,交叉比对则是把不同数据项信息进行关联和一致性校验,而统计聚合是指通过统计聚合函数对数据项信息进行处理的加工标签方法。
本实施例中,在构建业务标签数据集之前对原始业务关联数据进行预处理的步骤,通过透传、交叉比对以及统计聚合处理等方式,对原始业务关联数据进行标签化分类以及处理,能够提高业务标签数据集的准确度。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的一种确定业务推荐目标的方法的一种确定业务推荐目标的装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个一种确定业务推荐目标的装置实施例中的具体限定可以参见上文中对于一种确定业务推荐目标的方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种确定业务推荐目标的装置,包括:原始业务数据模块、业务数据预处理模块、分析模型预测模块和推荐对象选取模块,其中:
原始业务数据模块,用于获取批量用户的原始业务关联数据,所述原始业务关联数据与若干待推荐业务相关联;
业务数据预处理模块,用于对所述原始业务关联数据进行预处理,筛选出与目标业务相关联的业务关联指标;
分析模型预测模块,用于调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果;
推荐对象选取模块,用于基于所述推荐响应预测结果对所述批量用户进行筛选,选取对所述目标业务的推荐行为的响应概率超过预设阈值的目标用户作为所述目标业务的推荐对象。
在其中一个实施例中,所述分析模型预测模块包括:
组合变量模块,用于对所述业务关联指标进行线性组合,得到所述逻辑回归分析模型的组合变量;
激活函数模块,用于调用所述逻辑回归分析模型的激活函数对所述组合变量进行函数变换,得到所述推荐响应预测结果,所述激活函数为:
式中,t为所述组合变量,S(t)为所述推荐响应预测结果。
在其中一个实施例中,所述分析模型预测模块之前,还包括:
历史业务数据模块,用于获取历史业务关联数据,所述历史业务关联数据与待推荐的目标业务相关联;
数据标签模块,用于基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集;
模型迭代训练模块,用于基于业务标签数据集对所述逻辑回归分析模型进行迭代训练,确定所述逻辑回归分析模型中对应不同所述业务关联指标的特征权重系数。
在其中一个实施例中,所述数据标签模块之后,还包括:
业务数据过滤模块,用于对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型。
在其中一个实施例中,所述业务数据过滤模块包括:
覆盖率过滤模块,用于获取不同的所述业务关联指标对样本用户的覆盖率,基于所述覆盖率对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设覆盖率阈值的所述业务关联指标;
和/或;
重要度过滤模块,用于获取所述业务关联标签的信息值,基于所述信息值对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设重要度阈值的所述业务关联指标;
和/或;
相关性过滤模块,用于获取随机组合的任意两个所述业务关联标签的相关性参数,基于所述相关性参数对所述业务标签数据集进行过滤,以对相关性参数高于预设的相关性阈值的所述业务关联指标进行择一保留。
在其中一个实施例中,所述数据标签模块包括:
原始数据预处理模块,用于对所述原始业务关联数据进行预处理,所述预处理包括透传处理、交叉比对分析以及统计聚合处理。
上述一种确定业务推荐目标的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种确定业务推荐目标的方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种确定业务推荐目标的方法,其特征在于,所述方法包括:
获取批量用户的原始业务关联数据,所述原始业务关联数据与若干待推荐业务相关联;
对所述原始业务关联数据进行预处理,筛选出与目标业务相关联的业务关联指标;
调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果;
基于所述推荐响应预测结果对所述批量用户进行筛选,选取对所述目标业务的推荐行为的响应概率超过预设阈值的目标用户作为所述目标业务的推荐对象。
2.根据权利要求1所述的方法,其特征在于,所述调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果包括:
对所述业务关联指标进行线性组合,得到所述逻辑回归分析模型的组合变量;
调用所述逻辑回归分析模型的激活函数对所述组合变量进行函数变换,得到所述推荐响应预测结果,所述激活函数为:
式中,t为所述组合变量,S(t)为所述推荐响应预测结果。
3.根据权利要求1所述的方法,其特征在于,所述调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果之前,还包括:
获取历史业务关联数据,所述历史业务关联数据与待推荐的目标业务相关联;
基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集;
基于业务标签数据集对所述逻辑回归分析模型进行迭代训练,确定所述逻辑回归分析模型中对应不同所述业务关联指标的特征权重系数。
4.根据权利要求3所述的方法,其特征在于,所述基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集之后,还包括:
对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型。
5.根据权利要求4所述的方法,其特征在于,所述对所述业务标签数据集进行过滤处理,基于过滤处理后的所述业务标签数据集训练所述逻辑回归分析模型包括:
获取不同的所述业务关联指标对样本用户的覆盖率,基于所述覆盖率对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设覆盖率阈值的所述业务关联指标;
和/或;
获取所述业务关联标签的信息值,基于所述信息值对所述业务标签数据集进行过滤,以滤除所述覆盖率低于预设重要度阈值的所述业务关联指标;
和/或;
获取随机组合的任意两个所述业务关联标签的相关性参数,基于所述相关性参数对所述业务标签数据集进行过滤,以对相关性参数高于预设的相关性阈值的所述业务关联指标进行择一保留。
6.根据权利要求3所述的方法,其特征在于,所述基于预设的关系型数据处理流程对所述原始业务关联数据进行处理,对所述原始业务关联数据赋予业务关联标签,得到业务标签数据集包括:
对所述原始业务关联数据进行预处理,所述预处理包括透传处理、交叉比对分析以及统计聚合处理。
7.一种确定业务推荐目标的装置,其特征在于,所述装置包括:
原始业务数据模块,用于获取批量用户的原始业务关联数据,所述原始业务关联数据与若干待推荐业务相关联;
业务数据预处理模块,用于对所述原始业务关联数据进行预处理,筛选出与目标业务相关联的业务关联指标;
分析模型预测模块,用于调用预构建的逻辑回归分析模型对所述业务关联指标进行预测处理,得到所述批量用户对所述目标业务的推荐响应预测结果;
推荐对象选取模块,用于基于所述推荐响应预测结果对所述批量用户进行筛选,选取对所述目标业务的推荐行为的响应概率超过预设阈值的目标用户作为所述目标业务的推荐对象。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311605599.7A CN117593082A (zh) | 2023-11-28 | 2023-11-28 | 确定业务推荐目标的方法、装置、计算机设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311605599.7A CN117593082A (zh) | 2023-11-28 | 2023-11-28 | 确定业务推荐目标的方法、装置、计算机设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117593082A true CN117593082A (zh) | 2024-02-23 |
Family
ID=89912950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311605599.7A Pending CN117593082A (zh) | 2023-11-28 | 2023-11-28 | 确定业务推荐目标的方法、装置、计算机设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117593082A (zh) |
-
2023
- 2023-11-28 CN CN202311605599.7A patent/CN117593082A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cerina et al. | World input-output network | |
Brezigar-Masten et al. | CART-based selection of bankruptcy predictors for the logit model | |
Messier Jr et al. | Inducing rules for expert system development: an example using default and bankruptcy data | |
CN110378786B (zh) | 模型训练方法、违约传导风险识别方法、装置及存储介质 | |
CN110738527A (zh) | 一种特征重要性排序方法、装置、设备和存储介质 | |
TWI464700B (zh) | 信用違約預測方法與裝置 | |
Cao et al. | Early warning of enterprise decline in a life cycle using neural networks and rough set theory | |
Arun et al. | Big data: review, classification and analysis survey | |
Tait et al. | Predicting the attitude towards electronic banking continued usage intentions among rural banking customers in South Africa | |
CN115983900A (zh) | 用户营销策略的构建方法、装置、设备、介质和程序产品 | |
CN110930242A (zh) | 一种可信度预测方法、装置、设备和存储介质 | |
Tasgetiren et al. | On the distributed software architecture of a data analysis workflow: A case study | |
Zhu et al. | A DEALG methodology for prediction of effective customers of internet financial loan products | |
Feng | Data Analysis and Prediction Modeling Based on Deep Learning in E‐Commerce | |
CN117035980A (zh) | 资源借调评估方法、装置、计算机设备和存储介质 | |
CN116467525A (zh) | 业务产品的推荐方法、装置、设备和存储介质 | |
CN117593082A (zh) | 确定业务推荐目标的方法、装置、计算机设备、存储介质 | |
CN115689713A (zh) | 异常风险数据处理方法、装置、计算机设备和存储介质 | |
Motohashi | Understanding AI driven innovation by linked database of scientific articles and patents | |
Carmignani et al. | Urban agglomerations and firm access to credit | |
Srinivas et al. | Bankers’ perception of big data for fraud detection and customer satisfaction | |
Yeh et al. | Predicting failure of P2P lending platforms through machine learning: The case in China | |
Luna-Reyes et al. | A Systems View of Enterprise Data Governance for Artificial Intelligence Applications in Government | |
Bai | Research on financial risk control of rural e-commerce | |
CN117853217A (zh) | 数据隐私保护的金融违约率预测方法、装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |