CN117952688A - 商户的分类方法、装置及电子设备 - Google Patents
商户的分类方法、装置及电子设备 Download PDFInfo
- Publication number
- CN117952688A CN117952688A CN202410039374.8A CN202410039374A CN117952688A CN 117952688 A CN117952688 A CN 117952688A CN 202410039374 A CN202410039374 A CN 202410039374A CN 117952688 A CN117952688 A CN 117952688A
- Authority
- CN
- China
- Prior art keywords
- index
- merchant
- data
- information
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000011156 evaluation Methods 0.000 claims abstract description 101
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 75
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims description 97
- 230000002159 abnormal effect Effects 0.000 claims description 38
- 238000012217 deletion Methods 0.000 claims description 29
- 230000037430 deletion Effects 0.000 claims description 29
- 238000012423 maintenance Methods 0.000 claims description 21
- 230000003044 adaptive effect Effects 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 9
- 238000011002 quantification Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000003860 storage Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 12
- 238000007726 management method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种商户的分类方法、装置及电子设备,该方法应用于大数据领域、金融科技领域或者其他技术领域,该方法包括:确定商户不同维度的指标数据,得到第一指标集合;对第一指标集合进行数据预处理操作,得到第二指标集合;采用自适应套索算法计算第二指标集合中每个第二指标的系数;对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果。通过本申请,解决了相关技术中通过交易支付信息的单一角度对商户进行分类,导致分类结果不准确的问题。
Description
技术领域
本申请涉及大数据领域、金融科技领域或者其他技术领域,具体而言,涉及一种商户的分类方法、装置及电子设备。
背景技术
随着商户收单业务逐渐饱和,提升商户客群的体验成为金融机构的重要发力点,由于传统商户业务市场拓展功能不足,所以金融机构需要向商户提供多种服务和有效管理措施,提高商户服务质量和扩展商户业务市场,提升商户客群体验。
目前,分类管理是一种常见的金融机构管理商户的方式,但是金融机构对商户的管理大多直接应用企业/个人客户管理办法,或仅从商户收单业务层针对商户客群进行分级,较少实现聚焦商户这一主体特征的针对性分类管理。由于金融机构的商户业务已经从单一的支付服务升级为涵盖多方面服务的综合性服务,如果金融机构仍然以支付结算手续费的单一角度评价商户业务和对商户进行分类,可能会导致分类结果不准确,从而使得金融机构无法向商户提供合适的服务。
针对相关技术中通过交易支付信息的单一角度对商户进行分类,导致分类结果不准确的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种商户的分类方法、装置及电子设备,以解决相关技术中通过交易支付信息的单一角度对商户进行分类,导致分类结果不准确的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种商户的分类方法,该方法包括:确定商户不同维度的指标数据,得到第一指标集合;对所述第一指标集合进行数据预处理操作,得到第二指标集合;采用自适应套索算法计算所述第二指标集合中每个第二指标的系数,其中,所述系数表征所述第二指标与商户资产的相关程度;对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;依据所述第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果。
进一步地,确定商户不同维度的指标数据,得到第一指标集合包括:基于所述商户的交易信息确定第一类指标集合,其中,所述交易信息至少包括以下信息之一:收入信息、贷款信息、产品销售信息;基于与所述商户进行交易的交易对象的信息确定第二类指标集合,其中,所述交易对象的信息至少包括以下信息之一:所述交易对象的数量信息、所述交易对象的交易金额信息、所述交易对象的推荐信息;基于所述商户的资产增长信息确定第三类指标集合;将所述第一类指标集合、所述第二类指标集合和所述第三类指标集合进行组合,得到所述第一指标集合。
进一步地,对所述第一指标集合进行数据预处理操作,得到第二指标集合包括:对所述第一指标集合中的指标数据进行异常值处理,得到第四指标集合;对所述第四指标集合中的指标数据进行缺失值处理,得到第五指标集合;对所述第五指标集合中的指标数据进行标准化处理,得到所述第二指标集合。
进一步地,对所述第一指标集合中的指标数据进行异常值处理,得到第四指标集合包括:采用预设算法检测所述第一指标集合中的异常指标数据,其中,所述预设算法至少包括以下算法之一:百分位数分布算法、箱型图算法,所述异常指标数据是指取值超出预设区间的指标数据;依据业务场景确定所述异常指标数据的取值范围,得到所述预设区间;依据所述预设区间对所述异常指标数据的取值进行调整,得到所述第四指标集合。
进一步地,对所述第四指标集合中的指标数据进行缺失值处理,得到第五指标集合包括:获取所述第四指标集合中的指标缺失数据,并计算所述指标缺失数据的缺失率,其中,所述指标缺失数据是指取值为空的指标数据;在所述缺失率超过预设缺失率阈值的情况下,删除所述指标缺失数据;在所述缺失率未超过所述预设缺失率阈值的情况下,采用多重插补方法对所述指标缺失数据进行插补,得到所述第五指标集合。
进一步地,采用自适应套索算法计算所述第二指标集合中每个第二指标的系数包括:采用所述自适应套索算法构建所述商户的资产规模的估计模型,得到目标模型,其中,所述目标模型中包含所述第二指标集合中的指标数据;依据所述自适应套索算法构建所述目标模型的约束条件,得到目标约束条件;采用编程函数对所述目标模型和所述目标约束条件进行编程,得到所述目标模型的代码;通过所述目标模型的代码对所述目标模型进行求解,得到每个第二指标的系数。
进一步地,依据所述第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果包括:依据预设量化规则对所述第二指标集合中的指标数据进行量化,得到每个第二指标的评价得分;依据每个第二指标的评价得分和每个第二指标的权重计算所述目标商户的评价得分;依据预设分类规则确定所述目标商户的评价得分对应的分类结果,得到所述分类结果。
进一步地,在依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果之后,所述方法还包括:依据预设推荐策略确定所述分类结果对应的推荐策略,得到目标推荐策略,其中,所述预设推荐策略至少包括以下策略之一:推荐策略、维护策略,所述推荐策略至少包括以下信息之一:系统信息、费用补偿信息、交易额度信息、推荐活动信息、金融服务信息,所述维护策略至少包括以下信息之一:走访信息、讲座信息;依据所述目标推荐策略对所述目标商户进行处理。
为了实现上述目的,根据本申请的另一方面,提供了一种商户的分类装置,该装置包括:第一确定单元,用于确定商户不同维度的指标数据,得到第一指标集合;第一处理单元,用于对所述第一指标集合进行数据预处理操作,得到第二指标集合;第一计算单元,用于采用自适应套索算法计算所述第二指标集合中每个第二指标的系数,其中,所述系数表征所述第二指标与商户资产的相关程度;第二处理单元,用于对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;第二计算单元,用于依据所述第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果。
进一步地,所述确定单元包括:第一确定子单元,用于基于所述商户的交易信息确定第一类指标集合,其中,所述交易信息至少包括以下信息之一:收入信息、贷款信息、产品销售信息;第二确定子单元,用于基于与所述商户进行交易的交易对象的信息确定第二类指标集合,其中,所述交易对象的信息至少包括以下信息之一:所述交易对象的数量信息、所述交易对象的交易金额信息、所述交易对象的推荐信息;第三确定子单元,用于基于所述商户的资产增长信息确定第三类指标集合;组合子单元,用于将所述第一类指标集合、所述第二类指标集合和所述第三类指标集合进行组合,得到所述第一指标集合。
进一步地,所述第一处理单元包括:第一处理子单元,用于对所述第一指标集合中的指标数据进行异常值处理,得到第四指标集合;第二处理子单元,用于对所述第四指标集合中的指标数据进行缺失值处理,得到第五指标集合;第三处理子单元,用于对所述第五指标集合中的指标数据进行标准化处理,得到所述第二指标集合。
进一步地,所述第一处理子单元包括:检测模块,用于采用预设算法检测所述第一指标集合中的异常指标数据,其中,所述预设算法至少包括以下算法之一:百分位数分布算法、箱型图算法,所述异常指标数据是指取值超出预设区间的指标数据;确定模块,用于依据业务场景确定所述异常指标数据的取值范围,得到所述预设区间;调整模块,用于依据所述预设区间对所述异常指标数据的取值进行调整,得到所述第四指标集合。
进一步地,所述第二处理子单元包括:获取模块,用于获取所述第四指标集合中的指标缺失数据,并计算所述指标缺失数据的缺失率,其中,所述指标缺失数据是指取值为空的指标数据;删除模块,用于在所述缺失率超过预设缺失率阈值的情况下,删除所述指标缺失数据;插补模块,用于在所述缺失率未超过所述预设缺失率阈值的情况下,采用多重插补方法对所述指标缺失数据进行插补,得到所述第五指标集合。
进一步地,所述第一计算单元包括:第一构建子单元,用于采用所述自适应套索算法构建所述商户的资产规模的估计模型,得到目标模型,其中,所述目标模型中包含所述第二指标集合中的指标数据;第二构建子单元,用于依据所述自适应套索算法构建所述目标模型的约束条件,得到目标约束条件;编程子单元,用于采用编程函数对所述目标模型和所述目标约束条件进行编程,得到所述目标模型的代码;求解子单元,用于通过所述目标模型的代码对所述目标模型进行求解,得到每个第二指标的系数。
进一步地,所述第二计算单元包括:量化子单元,用于依据预设量化规则对所述第二指标集合中的指标数据进行量化,得到每个第二指标的评价得分;计算子单元,用于依据每个第二指标的评价得分和每个第二指标的权重计算所述目标商户的评价得分;第四确定子单元,用于依据预设分类规则确定所述目标商户的评价得分对应的分类结果,得到所述分类结果。
进一步地,所述装置还包括:第二确定单元,用于在依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果之后,依据预设推荐策略确定所述分类结果对应的推荐策略,得到目标推荐策略,其中,所述预设推荐策略至少包括以下策略之一:推荐策略、维护策略,所述推荐策略至少包括以下信息之一:系统信息、费用补偿信息、交易额度信息、推荐活动信息、金融服务信息,所述维护策略至少包括以下信息之一:走访信息、讲座信息;第三处理单元,用于依据所述目标推荐策略对所述目标商户进行处理。
为了实现上述目的,根据本申请的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述商户的分类方法。
为了实现上述目的,根据本申请的一个方面,提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项所述商户的分类方法。
通过本申请,采用以下步骤:确定商户不同维度的指标数据,得到第一指标集合;对所述第一指标集合进行数据预处理操作,得到第二指标集合;采用自适应套索算法计算所述第二指标集合中每个第二指标的系数,其中,所述系数表征所述第二指标与商户资产的相关程度;对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;依据所述第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果,解决了相关技术中通过交易支付信息的单一角度对商户进行分类,导致分类结果不准确的问题。通过引入商户不同维度的指标数据,有利于从多个角度提取商户客群特征,从而提高商户分类结果的准确性,同时通过采用解决高维数据问题的自适应套索算法计算每个指标数据的系数,筛选与商户总资产规模的相关程度较高的指标数据,并分配相应的权重,从而能够计算商户的评价得分,以及根据评价得分对商户进行分类,提高了分类结果的准确性。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例一提供的商户的分类方法的流程图;
图2是根据本申请实施例一提供的可选的商户的分类方法的示意图一;
图3是根据本申请实施例一提供的可选的商户的分类方法的示意图二;
图4是根据本申请实施例一提供的可选的商户的分类方法的示意图三;
图5是根据本申请实施例一提供的可选的商户的分类方法的示意图四;
图6是根据本申请实施例二提供的商户的分类装置的示意图;
图7是根据本申请实施例五提供的商户的分类电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,本申请文件的处理方法、装置、存储介质及电子设备确定的方法和装置可用于金融科技领域在对商户进行分类的过程中,提高了分类结果的准确性,也可用于除金融科技领域之外的任意领域,本申请文件的处理方法、装置、存储介质及电子设备的方法和装置的应用领域不做限定。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息、采集的指标信息、采集到的商户信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据、采集的指标数据、采集到的商户数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关区域的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例一提供的商户的分类方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,确定商户不同维度的指标数据,得到第一指标集合。
在本实施例一中,金融机构在向商户提供服务时,由于资产规模较大的商户通常拥有更稳定的经营状况,因此,可以根据商户的资产规模对商户进行分类,从而向商户提供合适的服务。为了对商户进行分类,需要收集与商户的经营情况、交易情况和商户客群信息等信息相关的指标数据,从而根据商户的指标数据对商户进行分类。
步骤S102,对第一指标集合进行数据预处理操作,得到第二指标集合。
在本实施例一中,为了保证分类结果的准确性,需要对收集到的指标数据进行预处理操作,减少指标数据中的异常数据(例如,噪声数据、缺失数据等),避免这些异常数据对商户分类结果造成的影响,提高了商户分类结果的准确性。
步骤S103,采用自适应套索算法计算第二指标集合中每个第二指标的系数,其中,系数表征第二指标与商户资产的相关程度。
在本实施例一中,为了提高分类结果的准确性,需要考虑不同指标数据与商户总资产规模的相关程度,即每个第二指标数据的系数,避免相关程度较低的指标降低分类结果的准确性。因此,若采用自适应套索算法构建每个指标数据的系数评估模型,并进行求解,若求解得到的系数较高则说明对应的指标数据与商户总资产规模的相关程度较高,若求解得到的系数为0则说明对应的指标数据与商户总资产规模的不相关。
步骤S104,对每个第二指标的系数进行归一化处理,得到每个第二指标的权重。
在本实施例一中,由于自适应套索算法求得的指标系数之和可能不为1,所以需要对每个第二指标的系数进行归一化处理,得到每个第二指标的权重,以使指标权重之和等于1,保证权重计算时的准确性。归一化处理的计算公式可以如公式一所示,
其中,βj表示第j个指标(即上述的第二指标)的系数,φj(j=1,2,…,p)为第j个指标经过归一化处理后的权重(即上述的权重),p为指标数量。
步骤S105,依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果。
在本实施例一中,确定每个第二指标的权重后,对每个第二指标的指标数据进行量化,得到每个第二指标的评价得分,然后采用线性加权法对每个第二指标的评价得分和每个第二指标的权重进行计算,得到目标商户的评价得分,进而根据目标商户的评价得分对目标商户进行分类,得到上述的分类结果。
综上所述,本申请实施例一提供的商户的分类方法,通过确定商户不同维度的指标数据,得到第一指标集合;对第一指标集合进行数据预处理操作,得到第二指标集合;采用自适应套索算法计算第二指标集合中每个第二指标的系数,其中,系数表征第二指标与商户资产的相关程度;对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果,解决了相关技术中通过交易支付信息的单一角度对商户进行分类,导致分类结果不准确的问题。通过引入商户不同维度的指标数据,有利于从多个角度提取商户客群特征,从而提高商户分类结果的准确性,同时通过采用解决高维数据问题的自适应套索算法计算每个指标数据的系数,筛选与商户总资产规模的相关程度较高的指标数据,并分配相应的权重,从而能够计算商户的评价得分,以及根据评价得分对商户进行分类,提高了分类结果的准确性。
可选地,在本申请实施例一提供的商户的分类方法中,确定商户不同维度的指标数据,得到第一指标集合包括:基于商户的交易信息确定第一类指标集合,其中,交易信息至少包括以下信息之一:收入信息、贷款信息、产品销售信息;基于与商户进行交易的交易对象的信息确定第二类指标集合,其中,交易对象的信息至少包括以下信息之一:交易对象的数量信息、交易对象的交易金额信息、交易对象的推荐信息;基于商户的资产增长信息确定第三类指标集合;将第一类指标集合、第二类指标集合和第三类指标集合进行组合,得到第一指标集合。
在本实施例一中,为了对商户进行分类,需要获取商户在多个维度的指标和指标数据,从而能够在多个维度对商户的资产规模进行综合评价,进而提高分类结果的准确性。
具体地,从商户客群的经济情况(即上述的交易信息)、生态情况(即上述的与商户进行交易的交易对象的信息)和潜在趋势(即上述的商户的资产增长信息)这三个维度分别选取评价指标,其中,以商户的资产总额作为被解释变量(y),剩余各个指标变量xi对y的影响都是正向的。
经济情况是指商户直接带来的可反映在收入支出上的价值,第一类指标可以包括:收入信息,例如,商户的现金收入、手续费收入等收入信息;贷款信息,例如,贷款收入信息;销售信息,例如,各种产品的销售收入信息。
生态情况是指商户与企业客户和个人客户的联系情况,主要体现商户增加个人客户的能力,活跃客户购买能力。因此,第二类指标可以包括:商户的交易数量、商户的客户的新增数量、商户的交易金额、商户向客户推荐活动数量和客户参与活动数量。
潜在趋势是指预测商户未来带来的经济效益的指标,第三类指标可以包括:资产留存率、收益来源数量和总资产增长率。
可选地,在本申请实施例一提供的商户的分类方法中,对第一指标集合进行数据预处理操作,得到第二指标集合包括:对第一指标集合中的指标数据进行异常值处理,得到第四指标集合;对第四指标集合中的指标数据进行缺失值处理,得到第五指标集合;对第五指标集合中的指标数据进行标准化处理,得到第二指标集合。
在本实施例一中,由于收集的指标数据会存在数据的缺失、不一致、噪声污染等问题,需要先对第一指标集合中的指标数据进行异常值处理、缺失值处理和标准化处理,得到第二指标集合,提高指标数据的质量,从而有利于提高计算的准确程度,达到了提高分类结果的准确性的效果。
具体地,首先对指标数据进行异常值处理,减少指标数据中的噪声,然后对指标数据进行缺失值处理,以填补缺失值,避免缺失值导致计算结果不准确的问题,最后,经过上述数据处理之后进行数据归一化处理,由于收集的指标数据存在单位、量纲的不同,例如,某些指标数据以“元”为单位,其它指标数据以“个”为单位。因此,为解决数据量纲不同而带来的数据变量间不可比性的问题,采用公式二对指标数据进行标准化处理,公式二如下所示,
其中,vij表示标准化后的指标数据,A的值为1,B值为2,表示第i个商户的第j个指标数据,/>表示第i个商户的第j个指标数据中的最小值,/>表示第i个商户的第j个指标数据中的最大值。
可选地,在本申请实施例一提供的商户的分类方法中,对第一指标集合中的指标数据进行异常值处理,得到第四指标集合包括:采用预设算法检测第一指标集合中的异常指标数据,其中,预设算法至少包括以下算法之一:百分位数分布算法、箱型图算法,异常指标数据是指取值超出预设区间的指标数据;依据业务场景确定异常指标数据的取值范围,得到预设区间;依据预设区间对异常指标数据的取值进行调整,得到第四指标集合。
在本实施例一中,需要对采集到的指标数据进行异常值检测和异常值处理,减少数据噪声造成的影响,从而提高指标数据的准确性,进而达到了提高商户分类结果的准确性的效果。
具体地,针对数据异常值处理首先利用百分位数分布和箱型图检测异常值。百分位数分布将数据按照大小顺序排列,并分为100等份,例如,第25百分位数表示有25%的数据小于或等于它。异常值会偏离正常数据的百分位数分布,例如,如果数据集中的某个值远超过了其他值的99百分位数,那么这个值很可能是异常值。箱型图(Box plot)是一种用于显示数据分布的统计图表,它展示了数据的中位数、上下四分位数、最大值和最小值,如果数据点在箱型图的上下四分位数之外,那么它很可能是一个异常值。
在检测出异常值之后,根据业务场景或业务需求确定异常值对应的指标的统计结果,再根据统计结果确定该指标的取值范围,从而将异常值修改为取值范围内的数值。
可选地,在本申请实施例一提供的商户的分类方法中,对第四指标集合中的指标数据进行缺失值处理,得到第五指标集合包括:获取第四指标集合中的指标缺失数据,并计算指标缺失数据的缺失率,其中,指标缺失数据是指取值为空的指标数据;在缺失率超过预设缺失率阈值的情况下,删除指标缺失数据;在缺失率未超过预设缺失率阈值的情况下,采用多重插补方法对指标缺失数据进行插补,得到第五指标集合。
在本实施例一中,需要对采集到的指标数据进行缺失数据检测和缺失数据处理,减少数据缺失造成的影响,从而提高指标数据的准确性,进而达到了提高商户分类结果的准确性的效果。
具体地,确定第四指标集合中每个指标的指标数据中缺失数据的分布情况,即指标数据的缺失率,例如,采集30天内每天产品销售收入这一指标,采集到其中15天的指标数据,缺失率为50%。在确定指标数据的缺失率后,判断缺失率是否大于预设缺失率阈值(例如,99%),若某一指标的指标数据缺失率大于预设缺失率阈值,则删除该指标,若某一指标的指标数据缺失率小于或等于预设缺失率阈值,则利用多重插补方法对缺失数据进行插补,或直接将缺失数据的值赋值为0。
可选地,在本申请实施例一提供的商户的分类方法中,采用自适应套索算法计算第二指标集合中每个第二指标的系数包括:采用自适应套索算法构建商户的资产规模的估计模型,得到目标模型,其中,目标模型中包含第二指标集合中的指标数据;依据自适应套索算法构建目标模型的约束条件,得到目标约束条件;采用编程函数对目标模型和目标约束条件进行编程,得到目标模型的代码;通过目标模型的代码对目标模型进行求解,得到每个第二指标的系数。
在本实施例一中,为了从采集到的指标数据中确定与商户资产规模相关程度较高的指标数据,可以采用自适应套索(Lasso)算法构建指标权重的系数的估计模型和指标权重的系数的约束条件,从而根据估计模型和约束条件确定第二指标集合中与商户资产规模相关程度较高的指标数据,即每个第二指标的系数。
由于本方案选择了多维指标变量,所以指标变量彼此之间存在相关性,在计算时往往会产生多重共线问题。当存在多重共线性时,会造成系数估计不准确,从而使得结果不稳定,系数估计值的经济含义也往往不易解释。因此,本方案选择了处理高维数据问题常用的自适应Lasso方法进行变量选择。
具体地,自适应Lasso为不同的指标分配不同的系数和权重,系数表示每个指标与商户资产规模相关程度,系数为0则表示该指标不相关,在评估商户时使用系数在预设范围内的指标数据进行计算,从而重要的指标变量被保留,而不重要的指标变量被舍弃。基于自适应Lasso算法构建的系数的估计模型(即上述的目标模型)可以如公式三所示,
其中,ωj表示第j个指标的权重向量,λ≥0为调节参数,表示变量α和变量β在第三公式取值最小时进行取值,N表示商户数量,yi表示第i个商户的总资产规模,α表示自适应Lasso算法中的变量,p表示第二指标集合中的指标数量,xij表示第i个商户的第j个指标数据,βj表示第j个指标的系数。
根据设计的系数的估计模型和自适应Lasso相关理论,可以构建银行商户客群资产规模的研究模型,如公式四所示,
E=α+β1A1+β2A2+β3A3+β4A4+β5A5+β6A6+β7B1+β8B2+
β9B3+β10B4+β11C1+β12C2+β13C3(四)
其中,E表示商户的总资产规模,α表示公式三中的变量,βj表示第j个指标的系数,A1至A6表示第一类指标中的指标,B1至B4表示第二类指标中的指标,C1至C3表示第三类指标中的指标。按照自适应Lasso理论,添加约束条件其中,/>i=1,2,…,p,γ>0,s等于1,其中,/>表示第j个指标权重的估计值,/>表示第j个指标系数的估计值,使系数满足公式五,公式五如下所示,
其中,Yi(i=1,2,…,n)是第i个商户的总资产规模的观测值,Xi1,Xi2,…,Xi3(i=1,2,…,n)是第i个商户的第j个指标数据的观测值。
在确定目标模型和系数的约束条件后,采用R统计软件中的msgps包(即上述的编程函数)进行编程,得到目标模型和约束条件的代码,通过运行编写好的代码进行求解,求解获得自适应Lasso的系数路径图,最终可以筛选出指标变量及各指标变量的系数值,指标变量的系数值越大则说明该指标变量与商户总资产信息的相关程度更高。
可选地,在本申请实施例一提供的商户的分类方法中,依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果包括:依据预设量化规则对第二指标集合中的指标数据进行量化,得到每个第二指标的评价得分;依据每个第二指标的评价得分和每个第二指标的权重计算目标商户的评价得分;依据预设分类规则确定目标商户的评价得分对应的分类结果,得到分类结果。
在本实施例一中计算指标权重得到第二指标的权重之后,需要对每个指标数据进行量化,得到每个指标数据的评价得分,然后再根据每个指标数据的评价得分和每个指标数据的权重进行计算,得到商户的评价得分,从而对商户进行分类。通过对商户的指标数据进行量化,能够得到每个指标的评价得分,从而有利于对商户进行分类,避免了人为打分导致评价结果不准确的问题,提高了分类结果的准确性。
具体地,根据业务场景或业务需求确定商户每个指标的评价得分对应的指标数据的取值范围,即上述的预设量化规则,预设量化规则可以如表1所示,其中,指标1对应的指标数据为2万元时,该指标数据的评价得分为2分,指标2、指标3、指标4和指标5为其他指标取值范围的示例。
表1
然后,根据商户各项指标的评价得分分别乘以该指标的权重值(即上述的权重),并将各个乘积相加,得到商户的评价得分,计算公式如公式六所示,
F=xF1+yF2+zF3(六)
其中,F表示商户的评价得分,φj表示第j个指标的权重,F1包含第一类指标的各个指标,F2包含第二类指标的各个指标,F3包含第三类指标的各个指标。
最后,将目标商户的评价得分与预设分类规则进行对照确定目标商户的分类结果,例如,根据目标商户的评价得分上限为5分,最低为0分,可以划分为五类客户,第一类客户为评价得分在[0,1]区间范围内,第二类客户为评价得分在(1,2]区间范围内,第三类客户为评价得分在(2,3]区间范围内,第四类客户为评价得分在(3,4]区间范围内,第五类客户为评价得分在(4,5]区间范围内。
可选地,在本申请实施例一提供的商户的分类方法中,在依据目标商户的评价得分对目标商户进行分类,得到分类结果之后,上述的方法还包括:依据预设推荐策略确定分类结果对应的推荐策略,得到目标推荐策略,其中,预设推荐策略至少包括以下策略之一:推荐策略、维护策略,推荐策略至少包括以下信息之一:系统信息、费用补偿信息、交易额度信息、推荐活动信息、金融服务信息,维护策略至少包括以下信息之一:走访信息、讲座信息;依据目标推荐策略对目标商户进行处理。
在本实施例一中确定目标商户的分类结果后,有利于金融机构根据目标商户的分类结果向每一类商户提供适合的服务,提升分类施策、针对性服务的能力,实现服务的个性化、差异化和适用性的效果。
具体地,针对每类的商户客群特点进行分类管理,其中,分类管理包括差异化推荐、差异化维护两个方向,差异化推荐是指向不同类别的商户提供不同的推荐策略,差异化维护是指向不同类别的商户提供不同的维护策略。
差异化的推荐策略包括:是否提供管理系统、手续费补贴额度、是否包含额度通知、是否包含引流活动、是否包含专属金融服务等,推荐策略的示例可以如表2所示。
表2
差异化的维护策略包括:走访维护的频率、社群管理、专题权益活动(例如,插花活动等)、理财培训(例如,开展讲座)等维度。维护策略的示例可以如表3所示。
表3
在确定不同类别商户的推荐策略和维护策略(即上述的目标推荐策略)后,对每个类别的商户进行差异化服务。
可选地,在一可选的实施例中,本方案确定目标商户的目标推荐策略的流程可以如图2所示。从不同维度选取商户相关指标变量,组成初始样本集;对初始样本集进行数据清洗和数据归一化处理,得到目标样本;利用自适应Lasso方法对目标样本进行变量选择,得到重要指标和指标权重;更新计算指标权重,获得不同维度指标的归一化权重值,以构建商户客群的综合价值模型;对每个指标的取值范围进行评分,利用线性加权法将商户客群在各评价指标上的得分乘以该指标的归一化权重值,进行量化处理得到一个综合价值评分;根据综合价值分数划分商户客群阶层,确定不同星级,并对不同商户进行分类施策和针对性推荐策略。
可选地,在一可选的实施例中,本方案处理指标数据的流程可以如图3所示。从不同维度选取商户相关指标变量,组成初始样本集,然后对初始样本集进行数据清洗和数据标准化处理,得到目标样本。
可选地,在一可选的实施例中,本方案计算指标数据的权重的流程可以如图4所示。基于自适应Lasso算法构建指标数据的系数估计模型,以及构建约束条件,对系数估计模型和约束条件进行编程和求解,筛选出重要指标数据和各指标数据的指标权重。
可选地,在一可选的实施例中,本方案对商户进行分类,以及确定目标推荐策略的流程可以如图5所示。对计算出的指标进行归一化处理,根据每个指标数据和每个指标数据的权重构建商户客群的综合价值模型;根据预设量化规则对每个指标的指标数据进行量化,得到每个指标的评价得分;利用线性加权法将商户客群在各指标上的评价得分乘以该指标的归一化后的权重值,得到目标商户的综合价值评分(即上述的目标商户的评价得分);根据综合价值评分划分目标商户的客群阶层,确定不同分类级别,并对不同商户进行分类施策和针对性管理。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例二
本申请实施例二还提供了一种商户的分类装置,需要说明的是,本申请实施例二的商户的分类装置可以用于执行本申请实施例一所提供的用于商户的分类方法。以下对本申请实施例二提供的商户的分类装置进行介绍。
图6是根据本申请实施例二的商户的分类装置的示意图。如图6所示,该装置包括:第一确定单元601、第一处理单元602、第一计算单元603、第二处理单元604和第二计算单元605。
具体地,第一确定单元601,用于确定商户不同维度的指标数据,得到第一指标集合。
第一处理单元602,用于对第一指标集合进行数据预处理操作,得到第二指标集合。
第一计算单元603,用于采用自适应套索算法计算第二指标集合中每个第二指标的系数,其中,系数表征第二指标与商户资产的相关程度。
第二处理单元604,用于对每个第二指标的系数进行归一化处理,得到每个第二指标的权重。
第二计算单元605,用于依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果。
本申请实施例二提供的商户的分类装置,通过第一确定单元601确定商户不同维度的指标数据,得到第一指标集合;第一处理单元602对第一指标集合进行数据预处理操作,得到第二指标集合;第一计算单元603采用自适应套索算法计算第二指标集合中每个第二指标的系数,其中,系数表征第二指标与商户资产的相关程度;第二处理单元604对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;第二计算单元605依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果,解决了相关技术中通过交易支付信息的单一角度对商户进行分类,导致分类结果不准确的问题。通过引入商户不同维度的指标数据,有利于从多个角度提取商户客群特征,从而提高商户分类结果的准确性,同时通过采用解决高维数据问题的自适应套索算法计算每个指标数据的系数,筛选与商户总资产规模的相关程度较高的指标数据,并分配相应的权重,从而能够计算商户的评价得分,以及根据评价得分对商户进行分类,提高了分类结果的准确性。
可选地,在本申请实施例二提供的商户的分类装置中,上述的第一确定单元601包括:第一确定子单元,用于基于商户的交易信息确定第一类指标集合,其中,交易信息至少包括以下信息之一:收入信息、贷款信息、产品销售信息;第二确定子单元,用于基于与商户进行交易的交易对象的信息确定第二类指标集合,其中,交易对象的信息至少包括以下信息之一:交易对象的数量信息、交易对象的交易金额信息、交易对象的推荐信息;第三确定子单元,用于基于商户的资产增长信息确定第三类指标集合;组合子单元,用于将第一类指标集合、第二类指标集合和第三类指标集合进行组合,得到第一指标集合。
可选地,在本申请实施例二提供的商户的分类装置中,上述的第一处理单元602包括:第一处理子单元,用于对第一指标集合中的指标数据进行异常值处理,得到第四指标集合;第二处理子单元,用于对第四指标集合中的指标数据进行缺失值处理,得到第五指标集合;第三处理子单元,用于对第五指标集合中的指标数据进行标准化处理,得到第二指标集合。
可选地,在本申请实施例二提供的商户的分类装置中,上述的第一处理子单元包括:检测模块,用于采用预设算法检测第一指标集合中的异常指标数据,其中,预设算法至少包括以下算法之一:百分位数分布算法、箱型图算法,异常指标数据是指取值超出预设区间的指标数据;确定模块,用于依据业务场景确定异常指标数据的取值范围,得到预设区间;调整模块,用于依据预设区间对异常指标数据的取值进行调整,得到第四指标集合。
可选地,在本申请实施例二提供的商户的分类装置中,上述的第二处理子单元包括:获取模块,用于获取第四指标集合中的指标缺失数据,并计算指标缺失数据的缺失率,其中,指标缺失数据是指取值为空的指标数据;删除模块,用于在缺失率超过预设缺失率阈值的情况下,删除指标缺失数据;插补模块,用于在缺失率未超过预设缺失率阈值的情况下,采用多重插补方法对指标缺失数据进行插补,得到第五指标集合。
可选地,在本申请实施例二提供的商户的分类装置中,上述的第一计算单元603包括:第一构建子单元,用于采用自适应套索算法构建商户的资产规模的估计模型,得到目标模型,其中,目标模型中包含第二指标集合中的指标数据;第二构建子单元,用于依据自适应套索算法构建目标模型的约束条件,得到目标约束条件;编程子单元,用于采用编程函数对目标模型和目标约束条件进行编程,得到目标模型的代码;求解子单元,用于通过目标模型的代码对目标模型进行求解,得到每个第二指标的系数。
可选地,在本申请实施例二提供的商户的分类装置中,上述的第二计算单元605包括:量化子单元,用于依据预设量化规则对第二指标集合中的指标数据进行量化,得到每个第二指标的评价得分;计算子单元,用于依据每个第二指标的评价得分和每个第二指标的权重计算目标商户的评价得分;第四确定子单元,用于依据预设分类规则确定目标商户的评价得分对应的分类结果,得到分类结果。
可选地,在本申请实施例二提供的商户的分类装置中,上述的装置还包括:第二确定单元,用于在依据目标商户的评价得分对目标商户进行分类,得到分类结果之后,依据预设推荐策略确定分类结果对应的推荐策略,得到目标推荐策略,其中,预设推荐策略至少包括以下策略之一:推荐策略、维护策略,推荐策略至少包括以下信息之一:系统信息、费用补偿信息、交易额度信息、推荐活动信息、金融服务信息,维护策略至少包括以下信息之一:走访信息、讲座信息;第三处理单元,用于依据目标推荐策略对目标商户进行处理。
所述商户的分类装置包括处理器和存储器,上述的第一确定单元601、第一处理单元602、第一计算单元603、第二处理单元604和第二计算单元605等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高分类结果的准确性。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例三提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现商户的分类方法。
本发明实施例四提供了一种处理器,处理器用于运行程序,其中,程序运行时执行商户的分类方法。
如图7所示,本发明实施例五提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:确定商户不同维度的指标数据,得到第一指标集合;对第一指标集合进行数据预处理操作,得到第二指标集合;采用自适应套索算法计算第二指标集合中每个第二指标的系数,其中,系数表征第二指标与商户资产的相关程度;对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果。
处理器执行程序时还实现以下步骤:确定商户不同维度的指标数据,得到第一指标集合包括:基于商户的交易信息确定第一类指标集合,其中,交易信息至少包括以下信息之一:收入信息、贷款信息、产品销售信息;基于与商户进行交易的交易对象的信息确定第二类指标集合,其中,交易对象的信息至少包括以下信息之一:交易对象的数量信息、交易对象的交易金额信息、交易对象的推荐信息;基于商户的资产增长信息确定第三类指标集合;将第一类指标集合、第二类指标集合和第三类指标集合进行组合,得到第一指标集合。
处理器执行程序时还实现以下步骤:对第一指标集合进行数据预处理操作,得到第二指标集合包括:对第一指标集合中的指标数据进行异常值处理,得到第四指标集合;对第四指标集合中的指标数据进行缺失值处理,得到第五指标集合;对第五指标集合中的指标数据进行标准化处理,得到第二指标集合。
处理器执行程序时还实现以下步骤:对第一指标集合中的指标数据进行异常值处理,得到第四指标集合包括:采用预设算法检测第一指标集合中的异常指标数据,其中,预设算法至少包括以下算法之一:百分位数分布算法、箱型图算法,异常指标数据是指取值超出预设区间的指标数据;依据业务场景确定异常指标数据的取值范围,得到预设区间;依据预设区间对异常指标数据的取值进行调整,得到第四指标集合。
处理器执行程序时还实现以下步骤:对第四指标集合中的指标数据进行缺失值处理,得到第五指标集合包括:获取第四指标集合中的指标缺失数据,并计算指标缺失数据的缺失率,其中,指标缺失数据是指取值为空的指标数据;在缺失率超过预设缺失率阈值的情况下,删除指标缺失数据;在缺失率未超过预设缺失率阈值的情况下,采用多重插补方法对指标缺失数据进行插补,得到第五指标集合。
处理器执行程序时还实现以下步骤:采用自适应套索算法计算第二指标集合中每个第二指标的系数包括:采用自适应套索算法构建商户的资产规模的估计模型,得到目标模型,其中,目标模型中包含第二指标集合中的指标数据;依据自适应套索算法构建目标模型的约束条件,得到目标约束条件;采用编程函数对目标模型和目标约束条件进行编程,得到目标模型的代码;通过目标模型的代码对目标模型进行求解,得到每个第二指标的系数。
处理器执行程序时还实现以下步骤:依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果包括:依据预设量化规则对第二指标集合中的指标数据进行量化,得到每个第二指标的评价得分;依据每个第二指标的评价得分和每个第二指标的权重计算目标商户的评价得分;依据预设分类规则确定目标商户的评价得分对应的分类结果,得到分类结果。
处理器执行程序时还实现以下步骤:在依据目标商户的评价得分对目标商户进行分类,得到分类结果之后,上述的方法还包括:依据预设推荐策略确定分类结果对应的推荐策略,得到目标推荐策略,其中,预设推荐策略至少包括以下策略之一:推荐策略、维护策略,推荐策略至少包括以下信息之一:系统信息、费用补偿信息、交易额度信息、推荐活动信息、金融服务信息,维护策略至少包括以下信息之一:走访信息、讲座信息;依据目标推荐策略对目标商户进行处理。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:确定商户不同维度的指标数据,得到第一指标集合;对第一指标集合进行数据预处理操作,得到第二指标集合;采用自适应套索算法计算第二指标集合中每个第二指标的系数,其中,系数表征第二指标与商户资产的相关程度;对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:确定商户不同维度的指标数据,得到第一指标集合包括:基于商户的交易信息确定第一类指标集合,其中,交易信息至少包括以下信息之一:收入信息、贷款信息、产品销售信息;基于与商户进行交易的交易对象的信息确定第二类指标集合,其中,交易对象的信息至少包括以下信息之一:交易对象的数量信息、交易对象的交易金额信息、交易对象的推荐信息;基于商户的资产增长信息确定第三类指标集合;将第一类指标集合、第二类指标集合和第三类指标集合进行组合,得到第一指标集合。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:对第一指标集合进行数据预处理操作,得到第二指标集合包括:对第一指标集合中的指标数据进行异常值处理,得到第四指标集合;对第四指标集合中的指标数据进行缺失值处理,得到第五指标集合;对第五指标集合中的指标数据进行标准化处理,得到第二指标集合。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:对第一指标集合中的指标数据进行异常值处理,得到第四指标集合包括:采用预设算法检测第一指标集合中的异常指标数据,其中,预设算法至少包括以下算法之一:百分位数分布算法、箱型图算法,异常指标数据是指取值超出预设区间的指标数据;依据业务场景确定异常指标数据的取值范围,得到预设区间;依据预设区间对异常指标数据的取值进行调整,得到第四指标集合。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:对第四指标集合中的指标数据进行缺失值处理,得到第五指标集合包括:获取第四指标集合中的指标缺失数据,并计算指标缺失数据的缺失率,其中,指标缺失数据是指取值为空的指标数据;在缺失率超过预设缺失率阈值的情况下,删除指标缺失数据;在缺失率未超过预设缺失率阈值的情况下,采用多重插补方法对指标缺失数据进行插补,得到第五指标集合。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:采用自适应套索算法计算第二指标集合中每个第二指标的系数包括:采用自适应套索算法构建商户的资产规模的估计模型,得到目标模型,其中,目标模型中包含第二指标集合中的指标数据;依据自适应套索算法构建目标模型的约束条件,得到目标约束条件;采用编程函数对目标模型和目标约束条件进行编程,得到目标模型的代码;通过目标模型的代码对目标模型进行求解,得到每个第二指标的系数。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:依据第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据目标商户的评价得分对目标商户进行分类,得到分类结果包括:依据预设量化规则对第二指标集合中的指标数据进行量化,得到每个第二指标的评价得分;依据每个第二指标的评价得分和每个第二指标的权重计算目标商户的评价得分;依据预设分类规则确定目标商户的评价得分对应的分类结果,得到分类结果。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:在依据目标商户的评价得分对目标商户进行分类,得到分类结果之后,上述的方法还包括:依据预设推荐策略确定分类结果对应的推荐策略,得到目标推荐策略,其中,预设推荐策略至少包括以下策略之一:推荐策略、维护策略,推荐策略至少包括以下信息之一:系统信息、费用补偿信息、交易额度信息、推荐活动信息、金融服务信息,维护策略至少包括以下信息之一:走访信息、讲座信息;依据目标推荐策略对目标商户进行处理。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种商户的分类方法,其特征在于,包括:
确定商户不同维度的指标数据,得到第一指标集合;
对所述第一指标集合进行数据预处理操作,得到第二指标集合;
采用自适应套索算法计算所述第二指标集合中每个第二指标的系数,其中,所述系数表征所述第二指标与商户资产的相关程度;
对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;
依据所述第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果。
2.根据权利要求1所述的方法,其特征在于,确定商户不同维度的指标数据,得到第一指标集合包括:
基于所述商户的交易信息确定第一类指标集合,其中,所述交易信息至少包括以下信息之一:收入信息、贷款信息、产品销售信息;
基于与所述商户进行交易的交易对象的信息确定第二类指标集合,其中,所述交易对象的信息至少包括以下信息之一:所述交易对象的数量信息、所述交易对象的交易金额信息、所述交易对象的推荐信息;
基于所述商户的资产增长信息确定第三类指标集合;
将所述第一类指标集合、所述第二类指标集合和所述第三类指标集合进行组合,得到所述第一指标集合。
3.根据权利要求1所述的方法,其特征在于,对所述第一指标集合进行数据预处理操作,得到第二指标集合包括:
对所述第一指标集合中的指标数据进行异常值处理,得到第四指标集合;
对所述第四指标集合中的指标数据进行缺失值处理,得到第五指标集合;
对所述第五指标集合中的指标数据进行标准化处理,得到所述第二指标集合。
4.根据权利要求3所述的方法,其特征在于,对所述第一指标集合中的指标数据进行异常值处理,得到第四指标集合包括:
采用预设算法检测所述第一指标集合中的异常指标数据,其中,所述预设算法至少包括以下算法之一:百分位数分布算法、箱型图算法,所述异常指标数据是指取值超出预设区间的指标数据;
依据业务场景确定所述异常指标数据的取值范围,得到所述预设区间;
依据所述预设区间对所述异常指标数据的取值进行调整,得到所述第四指标集合。
5.根据权利要求3所述的方法,其特征在于,对所述第四指标集合中的指标数据进行缺失值处理,得到第五指标集合包括:
获取所述第四指标集合中的指标缺失数据,并计算所述指标缺失数据的缺失率,其中,所述指标缺失数据是指取值为空的指标数据;
在所述缺失率超过预设缺失率阈值的情况下,删除所述指标缺失数据;
在所述缺失率未超过所述预设缺失率阈值的情况下,采用多重插补方法对所述指标缺失数据进行插补,得到所述第五指标集合。
6.根据权利要求1所述的方法,其特征在于,采用自适应套索算法计算所述第二指标集合中每个第二指标的系数包括:
采用所述自适应套索算法构建所述商户的资产规模的估计模型,得到目标模型,其中,所述目标模型中包含所述第二指标集合中的指标数据;
依据所述自适应套索算法构建所述目标模型的约束条件,得到目标约束条件;
采用编程函数对所述目标模型和所述目标约束条件进行编程,得到所述目标模型的代码;
通过所述目标模型的代码对所述目标模型进行求解,得到每个第二指标的系数。
7.根据权利要求1所述的方法,其特征在于,依据所述第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果包括:
依据预设量化规则对所述第二指标集合中的指标数据进行量化,得到每个第二指标的评价得分;
依据每个第二指标的评价得分和每个第二指标的权重计算所述目标商户的评价得分;
依据预设分类规则确定所述目标商户的评价得分对应的分类结果,得到所述分类结果。
8.根据权利要求1所述的方法,其特征在于,在依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果之后,所述方法还包括:
依据预设推荐策略确定所述分类结果对应的推荐策略,得到目标推荐策略,其中,所述预设推荐策略至少包括以下策略之一:推荐策略、维护策略,所述推荐策略至少包括以下信息之一:系统信息、费用补偿信息、交易额度信息、推荐活动信息、金融服务信息,所述维护策略至少包括以下信息之一:走访信息、讲座信息;
依据所述目标推荐策略对所述目标商户进行处理。
9.一种商户的分类装置,其特征在于,包括:
第一确定单元,用于确定商户不同维度的指标数据,得到第一指标集合;
第一处理单元,用于对所述第一指标集合进行数据预处理操作,得到第二指标集合;
第一计算单元,用于采用自适应套索算法计算所述第二指标集合中每个第二指标的系数,其中,所述系数表征所述第二指标与商户资产的相关程度;
第二处理单元,用于对每个第二指标的系数进行归一化处理,得到每个第二指标的权重;
第二计算单元,用于依据所述第二指标集合和每个第二指标的权重计算目标商户的评价得分,并依据所述目标商户的评价得分对所述目标商户进行分类,得到分类结果。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任意一项所述的商户的分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410039374.8A CN117952688A (zh) | 2024-01-10 | 2024-01-10 | 商户的分类方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410039374.8A CN117952688A (zh) | 2024-01-10 | 2024-01-10 | 商户的分类方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117952688A true CN117952688A (zh) | 2024-04-30 |
Family
ID=90800410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410039374.8A Pending CN117952688A (zh) | 2024-01-10 | 2024-01-10 | 商户的分类方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117952688A (zh) |
-
2024
- 2024-01-10 CN CN202410039374.8A patent/CN117952688A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Moscatelli et al. | Corporate default forecasting with machine learning | |
Maldonado et al. | Integrated framework for profit-based feature selection and SVM classification in credit scoring | |
CN108564286B (zh) | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 | |
US8577791B2 (en) | System and computer program for modeling and pricing loan products | |
Hsiao et al. | Using fuzzy super-efficiency slack-based measure data envelopment analysis to evaluate Taiwan’s commercial bank efficiency | |
US7546262B1 (en) | System and method for managing debt collection using clustering | |
US20150032598A1 (en) | System and method for generating a natural hazard credit model | |
JP2003530649A (ja) | ネットワーク上で具現された個人化した投資諮問システムおよびその方法 | |
CN102439623A (zh) | 动态产生增强信用评估的详细交易支付经历的方法和系统 | |
CN116468273A (zh) | 客户风险识别方法及装置 | |
CN114529400A (zh) | 一种消费贷款预授信评估方法、设备及介质 | |
Amendola et al. | Variable selection in default risk models | |
Kant et al. | Nowcasting GDP using machine learning methods | |
CN116542747A (zh) | 产品推荐方法、装置、存储介质及电子设备 | |
CN115860924A (zh) | 供应链金融信用风险预警方法及相关设备 | |
CN117252677A (zh) | 信贷额度确定方法和装置、电子设备及存储介质 | |
CN117952688A (zh) | 商户的分类方法、装置及电子设备 | |
CN115099933A (zh) | 一种业务预算方法、装置及设备 | |
CN115186101A (zh) | 一种投资管理后端系统、方法、设备及存储介质 | |
CN114219611A (zh) | 贷款额度计算方法、装置、计算机设备和存储介质 | |
CN113723710B (zh) | 一种客户流失预测方法、系统、存储介质及电子设备 | |
CN117495549A (zh) | 贷款的处理方法及装置、存储介质和电子设备 | |
CN116485446A (zh) | 业务数据的处理方法、装置、处理器以及电子设备 | |
CN116485537A (zh) | 金融产品的选择方法、装置、处理器以及电子设备 | |
CN117670048A (zh) | 金融产品组合的评估方法、装置、存储介质以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |