CN115423631A - 基于产业互联网平台交易数据的交易会员评分方法及系统 - Google Patents
基于产业互联网平台交易数据的交易会员评分方法及系统 Download PDFInfo
- Publication number
- CN115423631A CN115423631A CN202211201936.1A CN202211201936A CN115423631A CN 115423631 A CN115423631 A CN 115423631A CN 202211201936 A CN202211201936 A CN 202211201936A CN 115423631 A CN115423631 A CN 115423631A
- Authority
- CN
- China
- Prior art keywords
- scoring
- data
- dimension
- data set
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了基于产业互联网平台交易数据的交易会员评分方法及系统,该方法包括从产业互联网平台数据库提取全产业互联网平台会员的历史交易数据;建立第一评分维度数据集、第二评分维度数据集和第三评分维度数据集;使用训练集训练得到维度逻辑回归评分卡模型;使用测试集对维度逻辑回归评分卡模型进行测试,评估模型效果,并判断模型效果是否为较佳效果;根据维度逻辑回归评分卡模型和给定参数,计算得到评分卡;根据评分卡中的评分项,对提出业务需要的客户进行评分。本发明解决了目前大部分银行采用传统的对生产资料线下核验、经营资料等办理贷款方式对接产业互联网平台上的客户,缺乏为应用产业互联网交易数据而作的信用评分应用的问题。
Description
技术领域
本发明涉及产业互联网平台交易数据处理技术领域,特别是基于产业互联网平台交易数据的交易会员评分方法及系统。
背景技术
随着我国经济发展,产业互联网逐步发展壮大。在金融产品的风险控制方面,对商业客户进行信用评分是主要采用的方式。信用评分是指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。根据客户的信用分数,授信人可以分析客户的信用等级以此来给予不同客户的推荐不同业务。在信用评分的过程中,最关键的就是信用评分模型的构建。
目前的产业互联网客户融资产品的业务开展,主要是由银行对接产业互联网平台上的客户完成。目前大部分银行采用的是传统的对生产资料线下核验、经营资料等办理贷款,缺乏了为应用产业互联网交易数据而作的信用评分应用。
发明内容
针对上述缺陷,本发明提出了基于产业互联网平台交易数据的交易会员评分方法及系统,其目的在于解决目前大部分银行采用传统的对生产资料线下核验、经营资料等办理贷款方式对接产业互联网平台上的客户,缺乏为应用产业互联网交易数据而作的信用评分应用的问题。
为达此目的,本发明采用以下技术方案:
基于产业互联网平台交易数据的交易会员评分方法,包括以下步骤:
步骤S1:从产业互联网平台数据库中,提取全产业互联网平台会员的历史交易数据;
步骤S2:对历史交易数据进行数据分析和清空,并统计历史交易数据中每列数据数值为空的数量,计算每列数据的缺失率;对于缺失率大于第一预设值的列数据进行删除,对于数值大于第二预设值的异常数据进行近似替换;
步骤S3:根据清空后的历史交易数据,建立第一评分维度数据集;
步骤S4:对所述第一评分维度数据集中每个评分维度进行共线性探索,分别生成一一对应的散点图,并排除相关度高的评分维度,得到第二评分维度数据集;
步骤S5:对所述第二评分维度数据集进行划分,划分为训练集、测试集和验证集;
步骤S6:对所述第二评分维度数据集中全部评分维度计算WOE值和IV值,并排除IV值小于第三预设值的评分维度,得到第三评分维度数据集;
步骤S7:根据所述训练集和所述第三评分维度数据集进行逻辑回归训练,得到维度逻辑回归评分卡模型;
步骤S8:使用所述测试集对维度逻辑回归评分卡模型进行测试,评估模型效果,并判断模型效果是否为较佳效果,若为较佳效果,则无需调整所述维度逻辑回归评分卡模型,若不是较佳效果,则需调整所述维度逻辑回归评分卡模型;
步骤S9:根据所述维度逻辑回归评分卡模型和给定参数,计算得到评分卡;
步骤S10:根据所述评分卡中的评分项,对提出业务需要的客户进行评分。
优选地,在步骤S3中,所述第一评分维度数据集包括所属行业、交易采购商数、交易采购商数增长率、交易金额占比、贸易金额增长率、每年累计贸易额、企业逾期率、交易次数、供应商品量、供应商品量增长率、单宗平均额、单宗平均额增长率、平均付款操作时间、复审不通过率以及逾期超90日次数。
优选地,在步骤S6中,对所述第二评分维度数据集中每个评分维度计算WOE值和IV值,具体的计算公式如下:
其中,i为WOE分箱的编号;GoodT为全部WOE分箱中良性样本的数量;Goodi为每个WOE分箱中良性样本的数量;BadT为全部WOE分箱中恶性样本的数量;Badi为每个WOE分箱中恶性样本的数量。
优选地,在步骤S9中,所述评分卡中的分值具体是每个WOE分箱中的得分,得分公式如下:
offset=score’-factor*odds
其中,factor表示WOE分箱的因子分值;offset表示计算WOE分箱中良性样本的参数;score’表示初始得分,给定值为720;pdo表示初始因子分值,给定值为20;odds表示区分比率,给定值为50;scoren表示第n个WOE分箱中的得分;n表示WOE分箱的数量;LR.intercept_n表示逻辑回归评分卡模型训练后得出的模型参数;coef_n表示逻辑回归评分卡模型中得出的每个评分维度的函数值;WOEn表示评分维度数据集中每个评分维度的WOE值。
优选地,全产业互联网平台会员的历史交易数据跟随着时间进行更新,通过对新的历史交易数据进行维度计算,得到新数据集,并将每个评分维度均提取出来进行PSI的比较,具体包括:
步骤S51:使用逻辑回归模型对新数据集进行预测,得到预测结果后将新数据集拆分成好客户数据集和坏客户数据集;
步骤S52:对所述好客户数据集和所述坏客户数据集根据评分结果进行排序,并将两个数据集各拆分为若干组;
步骤S53:将若干组所述好客户数据集和若干组所述坏客户数据集对应的得分转换成直方图。
本申请的另一方面提供了基于产业互联网平台交易数据的交易会员评分系统,所述系统包括:
提取模块,用于从产业互联网平台数据库中提取全产业互联网平台会员的历史交易数据;
第一数据处理模块,用于对历史交易数据进行数据分析和清空,并统计历史交易数据中每列数据数值为空的数量,计算每列数据的缺失率;对于缺失率大于第一预设值的列数据进行删除,对于数值大于第二预设值的异常数据进行近似替换;并根据清空后的历史交易数据,建立第一评分维度数据集;
第二数据处理模块,用于对所述第一评分维度数据集中每个评分维度进行共线性探索,分别生成一一对应的散点图,并排除相关度高的评分维度,得到第二评分维度数据集;
数据划分模块,用于对所述第二评分维度数据集进行划分,划分为训练集、测试集和验证集;
第三数据处理模块,用于对所述第二评分维度数据集中全部评分维度计算WOE值和IV值,并排除IV值小于第三预设值的评分维度,得到第三评分维度数据集;
模型建立模块,用于根据所述训练集和所述第三评分维度数据集进行逻辑回归训练,得到维度逻辑回归评分卡模型;
模型评估模块,用于使用所述测试集对维度逻辑回归评分卡模型进行测试,评估模型效果;
判断模块,用于判断模型效果是否为较佳效果,若为较佳效果,则无需调整所述维度逻辑回归评分卡模型,若不是较佳效果,则需调整所述维度逻辑回归评分卡模型;
评分卡生成模块,用于根据所述维度逻辑回归评分卡模型和给定参数,计算得到评分卡;
客户评分模块,用于根据所述评分卡中的评分项,对提出业务需要的客户进行评分。
优选地,还包括新数据集处理模块,所述新数据集处理模块包括预测子模块、第一拆分子模块、排序子模块、第二拆分子模块以及转换子模块;
所述预测模块用于使用逻辑回归模型对新数据集进行预测;
所述第二拆分子模块用于将得到预测结果后的新数据集拆分成好客户数据集和坏客户数据集;
所述排序子模块用于对所述好客户数据集和所述坏客户数据集根据评分结果进行排序;
所述第二拆分子模块用于将所述好客户数据集和所述坏客户数据集各拆分为若干组;
所述转换子模块用于将若干组所述好客户数据集和若干组所述坏客户数据集对应的得分转换成直方图。
本申请实施例提供的技术方案可以包括以下有益效果:
本方案中根据客户在产业互联网中的交易数据进行信用评分,更好地进行客户管理,合作维护;使产业互联网平台能够根据客户的信用评级对客户给予金融类业务的推荐,能够快速地为产业互联网平台客户提供信用评分,有利于构建传统产业上下游中小企业信用体系。
附图说明
图1是一种基于产业互联网平台交易数据的交易会员评分方法步骤图。
具体实施方式
下面详细描述本发明的实施方式,实施方式的示例在附图中示出,其中,相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
基于产业互联网平台交易数据的交易会员评分方法,包括以下步骤:
步骤S1:从产业互联网平台数据库中,提取全产业互联网平台会员的历史交易数据;
步骤S2:对历史交易数据进行数据分析和清空,并统计历史交易数据中每列数据数值为空的数量,计算每列数据的缺失率;对于缺失率大于第一预设值的列数据进行删除,对于数值大于第二预设值的异常数据进行近似替换;
步骤S3:根据清空后的历史交易数据,建立第一评分维度数据集;
步骤S4:对所述第一评分维度数据集中每个评分维度进行共线性探索,分别生成一一对应的散点图,并排除相关度高的评分维度,得到第二评分维度数据集;
步骤S5:对所述第二评分维度数据集进行划分,划分为训练集、测试集和验证集;
步骤S6:对所述第二评分维度数据集中全部评分维度计算WOE值和IV值,并排除IV值小于第三预设值的评分维度,得到第三评分维度数据集;
步骤S7:根据所述训练集和所述第三评分维度数据集进行逻辑回归训练,得到维度逻辑回归评分卡模型;
步骤S8:使用所述测试集对维度逻辑回归评分卡模型进行测试,评估模型效果,并判断模型效果是否为较佳效果,若为较佳效果,则无需调整所述维度逻辑回归评分卡模型,若不是较佳效果,则需调整所述维度逻辑回归评分卡模型;
步骤S9:根据所述维度逻辑回归评分卡模型和给定参数,计算得到评分卡;
步骤S10:根据所述评分卡中的评分项,对提出业务需要的客户进行评分。
本方案的基于产业互联网平台交易数据的交易会员评分方法,如图1所示,从产业互联网平台数据库中提取全产业互联网平台会员的历史交易数据,具体的,产业互联网平台是面向制造业数字化、网络化、智能化需求,构建基于海量数据采集、汇聚、分析的服务体系,支撑制造资源泛在连接、弹性供给、高效配置的工业云平台;对历史交易数据进行数据分析和清空,并统计历史交易数据中每列数据数值为空的量,计算每列数据的缺失率;对于缺失率大于第一预设值的列数据进行删除,对于数值大于第二预设值的异常数据进行近似替换,具体的,缺失率的计算公式是历史交易数据中任一列数据数值为空的数量/该列数据的数量,本实施例中第一预设值为30%,第二预设值为50;根据清空后的历史交易数据,建立第一评分维度数据集,具体的,第一评分维度数据集包括所属行业、交易采购商数、交易采购商数增长率、交易金额占比、贸易金额增长率、每年累计贸易额、企业逾期率、交易次数、供应商品量、供应商品量增长率、单宗平均额、单宗平均额增长率、平均付款操作时间、复审不通过率以及逾期超90日次数;对所述第一评分维度数据集中每个评分维度进行共线性探索,分别生成一一对应的散点图,并排除相关度高的评分维度,得到第二评分维度数据集,这样能够使评分维度数据集保持充分的单调性,具体的,相关度指的是每个评分维度之间的相关性;对所述第二评分维度数据集进行划分,划分为训练集、测试集和验证集,本实施例中训练集占总评分维度数据集的70%,测试集占总评分维度数据集的20%,验证集占总评分维度数据集的10%;对所述第二评分维度数据集中全部评分维度计算WOE值和IV值,并排除IV值小于第三预设值的评分维度,得到第三评分维度数据集,具体的,计算WOE值实际上计算WOE分箱,即将所述第二评分维度数据集分为若干个分箱,本实施例的第三预设值为0.03;使用训练集并选取第三评分维度数据集中的评分维度进行逻辑回归训练,得到维度逻辑回归评分卡模型;为了提高评分卡的评分效果,使用所述测试集对维度逻辑回归评分卡模型进行测试,评估模型效果,若模型效果为较佳效果,则无需调整维度逻辑回归评分卡模型,否则需调整维度逻辑回归评分卡模型;根据所述维度逻辑回归评分卡模型和给定参数,计算得到评分卡,该评分卡即为WOE分箱的得分集;业务人员通过评分卡中的评分项,对提出业务需求的客户进行评分,一般来说,评分卡分数越高,风险越小,客户信用越好。
本方案中根据客户在产业互联网中的交易数据进行信用评分,更好地进行客户管理,合作维护;使产业互联网平台能够根据客户的信用评级对客户给予金融类业务的推荐,能够快速地为产业互联网平台客户提供信用评分,有利于构建传统产业上下游中小企业信用体系。
优选的,在步骤S3中,所述第一评分维度数据集包括所属行业、交易采购商数、交易采购商数增长率、交易金额占比、贸易金额增长率、每年累计贸易额、企业逾期率、交易次数、供应商品量、供应商品量增长率、单宗平均额、单宗平均额增长率、平均付款操作时间、复审不通过率以及逾期超90日次数。
具体的,所属行业指的是平台会员主要经营所对应行业;交易采购商数指的是平台会员主要供应的采购商的数量;交易采购商数增长率指的是平台会员主要供应的采购商的数量的增长率;交易金额占比指的是平台会员每年交易额占全平台的交易额的占比;贸易金额增长率指的是平台会员每年贸易金额的增长率;每年累计贸易额指的是平台会员每年贸易金额的合计;企业逾期率指的是平台会员每年贸易金额中逾期金额的占比;交易次数指的是平台会员每年贸易订单数量;供应商品量指的是平台会员每年贸易提供的商品数量;供应商品量增长率指的是平台会员每年贸易提供的商品数量增长率;单宗平均额指的是平台会员每年贸易的单宗交易额的平均值;单宗平均额增长率指的是平台会员每年贸易的单宗交易额的平均值的增长率;平均付款操作时间指的是平台会员在平台上付款操作时间的平均值;复审不通过率指的是平台会员在平台上发起订单后,经审核后不通过的占比;逾期超90日次数指的是平台会员每年贸易中逾期的订单的计数。
优选的,在步骤S6中,对所述第二评分维度数据集中每个评分维度计算WOE值和IV值,具体的计算公式如下:
其中,i为WOE分箱的编号;GoodT为全部WOE分箱中良性样本的数量;Goodi为每个WOE分箱中良性样本的数量;BadT为全部WOE分箱中恶性样本的数量;Badi为每个WOE分箱中恶性样本的数量。
本实施例中,将所述第二评分维度数据集分为10个WOE分箱,计算得到每个WOE分箱的IV值,这样有利于计算每个WOE分箱里的恶性样本分布相对于良性样本分布之间的差异性。
优选的,在步骤S9中,所述评分卡中的分值具体是每个WOE分箱中的得分,得分公式如下:
offset=score’-factor*odds
其中,factor表示WOE分箱的因子分值;offset表示计算WOE分箱中良性样本的参数;score’表示初始得分,给定值为720;pdo表示初始因子分值,给定值为20;odds表示区分比率,给定值为50;scoren表示第n个WOE分箱中的得分;n表示WOE分箱的数量;LR.intercept_n表示逻辑回归评分卡模型训练后得出的模型参数;coef_n表示逻辑回归评分卡模型中得出的每个评分维度的函数值;WOEn表示评分维度数据集中每个评分维度的WOE值。
具体地,通过计算得到每个WOE分箱的得分,并将每个WOE分箱的得分、每个评分维度和区分区间列成一个表格,能够更加直观地观察每个评分维度的得分情况,有利于评估客户的信用。
优选的,全产业互联网平台会员的历史交易数据跟随着时间进行更新,通过对新的历史交易数据进行维度计算,得到新数据集,并将每个评分维度均提取出来进行PSI的比较,具体包括:
步骤S51:使用逻辑回归模型对新数据集进行预测,得到预测结果后将新数据集拆分成好客户数据集和坏客户数据集;
步骤S52:对所述好客户数据集和所述坏客户数据集根据评分结果进行排序,并将两个数据集各拆分为若干组;
步骤S53:将若干组所述好客户数据集和若干组所述坏客户数据集对应的得分转换成直方图。
随着经济发展、潮流趋势的变化,评分卡中的评分项也应随着变化。为此需要对评分模型进行更新检视。所以引入了稳定度指标(population stability index,PSI)。每过一段时间,全产业互联网平台会员的历史交易数据陆续更新,对新的历史交易数据进行维度计算后,获得新数据集,将参与评分的评分维度每一个都单独提取出来进行PSI的比较。
本实施例中,对所述好客户数据集和所述坏客户数据集根据评分结果进行排序,并将两个数据集各拆分为10组,并将10组所述好客户数据集和10组所述坏客户数据集对应的得分转换成直方图,能够更加直观地解读出好客户与坏客户的区分度,区分度越大,对应的维度效果则为越佳。
本申请的另一方面提供了基于产业互联网平台交易数据的交易会员评分系统,所述系统包括:
提取模块,用于从产业互联网平台数据库中提取全产业互联网平台会员的历史交易数据;
第一数据处理模块,用于对历史交易数据进行数据分析和清空,并统计历史交易数据中每列数据数值为空的数量,计算每列数据的缺失率;对于缺失率大于第一预设值的列数据进行删除,对于数值大于第二预设值的异常数据进行近似替换;并根据清空后的历史交易数据,建立第一评分维度数据集;
第二数据处理模块,用于对所述第一评分维度数据集中每个评分维度进行共线性探索,分别生成一一对应的散点图,并排除相关度高的评分维度,得到第二评分维度数据集;
数据划分模块,用于对所述第二评分维度数据集进行划分,划分为训练集、测试集和验证集;
第三数据处理模块,用于对所述第二评分维度数据集中全部评分维度计算WOE值和IV值,并排除IV值小于第三预设值的评分维度,得到第三评分维度数据集;
模型建立模块,用于根据所述训练集和所述第三评分维度数据集进行逻辑回归训练,得到维度逻辑回归评分卡模型;
模型评估模块,用于使用所述测试集对维度逻辑回归评分卡模型进行测试,评估模型效果;
判断模块,用于判断模型效果是否为较佳效果,若为较佳效果,则无需调整所述维度逻辑回归评分卡模型,若不是较佳效果,则需调整所述维度逻辑回归评分卡模型;
评分卡生成模块,用于根据所述维度逻辑回归评分卡模型和给定参数,计算得到评分卡;
客户评分模块,用于根据所述评分卡中的评分项,对提出业务需要的客户进行评分。
本申请提供了基于产业互联网平台交易数据的交易会员评分系统,通过提取模块、第一数据处理模块、第二数据处理模块、数据划分模块、第三数据处理模块、模型建立模块、模型评估模块、判断模块、评分卡生成模块和客户评分模块各模块的相互配合,实现了客户在产业互联网中交易的信用评分,能够更好地进行客户管理,合作维护。
其中,所述第一评分维度数据集包括所属行业、交易采购商数、交易采购商数增长率、交易金额占比、贸易金额增长率、每年累计贸易额、企业逾期率、交易次数、供应商品量、供应商品量增长率、单宗平均额、单宗平均额增长率、平均付款操作时间、复审不通过率以及逾期超90日次数。
对所述第二评分维度数据集中每个评分维度计算WOE值和IV值,具体的计算公式如下:
其中,i为WOE分箱的编号;GoodT为全部WOE分箱中良性样本的数量;Goodi为每个WOE分箱中良性样本的数量;BadT为全部WOE分箱中恶性样本的数量;Badi为每个WOE分箱中恶性样本的数量。
所述评分卡中的分值具体是每个WOE分箱中的得分,得分公式如下:
offset=score’-factor*odds
其中,factor表示WOE分箱的因子分值;offset表示计算WOE分箱中良性样本的参数;score’表示初始得分,给定值为720;pdo表示初始因子分值,给定值为20;odds表示区分比率,给定值为50;scoren表示第n个WOE分箱中的得分;n表示WOE分箱的数量;LR.intercept_n表示逻辑回归评分卡模型训练后得出的模型参数;coef_n表示逻辑回归评分卡模型中得出的每个评分维度的函数值;WOEn表示评分维度数据集中每个评分维度的WOE值。
优选的,还包括新数据集处理模块,所述新数据集处理模块包括预测子模块、第一拆分子模块、排序子模块、第二拆分子模块以及转换子模块;
所述预测模块用于使用逻辑回归模型对新数据集进行预测;
所述第二拆分子模块用于将得到预测结果后的新数据集拆分成好客户数据集和坏客户数据集;
所述排序子模块用于对所述好客户数据集和所述坏客户数据集根据评分结果进行排序;
所述第二拆分子模块用于将所述好客户数据集和所述坏客户数据集各拆分为若干组;
所述转换子模块用于将若干组所述好客户数据集和若干组所述坏客户数据集对应的得分转换成直方图。
本实施例中,通过预测子模块、第一拆分子模块、排序子模块、第二拆分子模块以及转换子模块的共同配合,得到最终的直方图能够更加直观地解读出好客户与坏客户的区分度,区分度越大,对应的维度效果则为越佳。
此外,在本发明的各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
尽管上面已经示出和描述了本发明的实施方式,可以理解的是,上述实施方式是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (7)
1.基于产业互联网平台交易数据的交易会员评分方法,其特征在于:包括以下步骤:
步骤S1:从产业互联网平台数据库中,提取全产业互联网平台会员的历史交易数据;
步骤S2:对历史交易数据进行数据分析和清空,并统计历史交易数据中每列数据数值为空的数量,计算每列数据的缺失率;对于缺失率大于第一预设值的列数据进行删除,对于数值大于第二预设值的异常数据进行近似替换;
步骤S3:根据清空后的历史交易数据,建立第一评分维度数据集;
步骤S4:对所述第一评分维度数据集中每个评分维度进行共线性探索,分别生成一一对应的散点图,并排除相关度高的评分维度,得到第二评分维度数据集;
步骤S5:对所述第二评分维度数据集进行划分,划分为训练集、测试集和验证集;
步骤S6:对所述第二评分维度数据集中全部评分维度计算WOE值和IV值,并排除IV值小于第三预设值的评分维度,得到第三评分维度数据集;
步骤S7:根据所述训练集和所述第三评分维度数据集进行逻辑回归训练,得到维度逻辑回归评分卡模型;
步骤S8:使用所述测试集对维度逻辑回归评分卡模型进行测试,评估模型效果,并判断模型效果是否为较佳效果,若为较佳效果,则无需调整所述维度逻辑回归评分卡模型,若不是较佳效果,则需调整所述维度逻辑回归评分卡模型;
步骤S9:根据所述维度逻辑回归评分卡模型和给定参数,计算得到评分卡;
步骤S10:根据所述评分卡中的评分项,对提出业务需要的客户进行评分。
2.根据权利要求1所述的基于产业互联网平台交易数据的交易会员评分方法,其特征在于:在步骤S3中,所述第一评分维度数据集包括所属行业、交易采购商数、交易采购商数增长率、交易金额占比、贸易金额增长率、每年累计贸易额、企业逾期率、交易次数、供应商品量、供应商品量增长率、单宗平均额、单宗平均额增长率、平均付款操作时间、复审不通过率以及逾期超90日次数。
4.根据权利要求1所述的基于产业互联网平台交易数据的交易会员评分方法,其特征在于:在步骤S9中,所述评分卡中的分值具体是每个WOE分箱中的得分,得分公式如下:
offset=score’-factor*odds
其中,factor表示WOE分箱的因子分值;offset表示计算WOE分箱中良性样本的参数;score’表示初始得分,给定值为720;pdo表示初始因子分值,给定值为20;odds表示区分比率,给定值为50;scoren表示第n个WOE分箱中的得分;n表示WOE分箱的数量;LR.intercept_n表示逻辑回归评分卡模型训练后得出的模型参数;coef_n表示逻辑回归评分卡模型中得出的每个评分维度的函数值;WOEn表示评分维度数据集中每个评分维度的WOE值。
5.根据权利要求1所述的基于产业互联网平台交易数据的交易会员评分方法,其特征在于:全产业互联网平台会员的历史交易数据跟随着时间进行更新,通过对新的历史交易数据进行维度计算,得到新数据集,并将每个评分维度均提取出来进行PSI的比较,具体包括:
步骤S51:使用逻辑回归模型对新数据集进行预测,得到预测结果后将新数据集拆分成好客户数据集和坏客户数据集;
步骤S52:对所述好客户数据集和所述坏客户数据集根据评分结果进行排序,并将两个数据集各拆分为若干组;
步骤S53:将若干组所述好客户数据集和若干组所述坏客户数据集对应的得分转换成直方图。
6.基于产业互联网平台交易数据的交易会员评分系统,其特征在于:使用权利要求1-5任一项所述基于产业互联网平台交易数据的交易会员评分方法,所述系统包括:
提取模块,用于从产业互联网平台数据库中提取全产业互联网平台会员的历史交易数据;
第一数据处理模块,用于对历史交易数据进行数据分析和清空,并统计历史交易数据中每列数据数值为空的数量,计算每列数据的缺失率;对于缺失率大于第一预设值的列数据进行删除,对于数值大于第二预设值的异常数据进行近似替换;并根据清空后的历史交易数据,建立第一评分维度数据集;
第二数据处理模块,用于对所述第一评分维度数据集中每个评分维度进行共线性探索,分别生成一一对应的散点图,并排除相关度高的评分维度,得到第二评分维度数据集;
数据划分模块,用于对所述第二评分维度数据集进行划分,划分为训练集、测试集和验证集;
第三数据处理模块,用于对所述第二评分维度数据集中全部评分维度计算WOE值和IV值,并排除IV值小于第三预设值的评分维度,得到第三评分维度数据集;
模型建立模块,用于根据所述训练集和所述第三评分维度数据集进行逻辑回归训练,得到维度逻辑回归评分卡模型;
模型评估模块,用于使用所述测试集对维度逻辑回归评分卡模型进行测试,评估模型效果;
判断模块,用于判断模型效果是否为较佳效果,若为较佳效果,则无需调整所述维度逻辑回归评分卡模型,若不是较佳效果,则需调整所述维度逻辑回归评分卡模型;
评分卡生成模块,用于根据所述维度逻辑回归评分卡模型和给定参数,计算得到评分卡;
客户评分模块,用于根据所述评分卡中的评分项,对提出业务需要的客户进行评分。
7.根据权利要求6所述的基于产业互联网平台交易数据的交易会员评分系统,其特征在于:还包括新数据集处理模块,所述新数据集处理模块包括预测子模块、第一拆分子模块、排序子模块、第二拆分子模块以及转换子模块;
所述预测模块用于使用逻辑回归模型对新数据集进行预测;
所述第二拆分子模块用于将得到预测结果后的新数据集拆分成好客户数据集和坏客户数据集;
所述排序子模块用于对所述好客户数据集和所述坏客户数据集根据评分结果进行排序;
所述第二拆分子模块用于将所述好客户数据集和所述坏客户数据集各拆分为若干组;
所述转换子模块用于将若干组所述好客户数据集和若干组所述坏客户数据集对应的得分转换成直方图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211201936.1A CN115423631A (zh) | 2022-09-29 | 2022-09-29 | 基于产业互联网平台交易数据的交易会员评分方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211201936.1A CN115423631A (zh) | 2022-09-29 | 2022-09-29 | 基于产业互联网平台交易数据的交易会员评分方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115423631A true CN115423631A (zh) | 2022-12-02 |
Family
ID=84205573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211201936.1A Pending CN115423631A (zh) | 2022-09-29 | 2022-09-29 | 基于产业互联网平台交易数据的交易会员评分方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115423631A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933944A (zh) * | 2024-03-14 | 2024-04-26 | 佛山众陶联供应链服务有限公司 | 一种便于税务快速稽查的交易数据处理方法及系统 |
-
2022
- 2022-09-29 CN CN202211201936.1A patent/CN115423631A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933944A (zh) * | 2024-03-14 | 2024-04-26 | 佛山众陶联供应链服务有限公司 | 一种便于税务快速稽查的交易数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Endri et al. | Determinants of efficiency of Indonesian Islamic rural banks | |
US20080071588A1 (en) | Method of and system for analyzing, modeling and valuing elements of a business enterprise | |
US8065227B1 (en) | Method and system for producing custom behavior scores for use in credit decisioning | |
CN111476660B (zh) | 一种基于数据分析的智能风控系统及方法 | |
CN111861698B (zh) | 一种基于贷款多头数据的贷前审批预警方法及系统 | |
CN108389069A (zh) | 基于随机森林和逻辑回归的优质客户识别方法及装置 | |
CN112801529B (zh) | 财务数据分析方法及装置、电子设备及介质 | |
CN109285038A (zh) | 一种通过bp神经网络预测银行客户流失的方法 | |
CN107093101A (zh) | 基于pos流水数据的潜在贷款用户挖掘与风险评分方法 | |
CN108364191A (zh) | 基于随机森林和逻辑回归的优质客户优化识别方法及装置 | |
CN115423631A (zh) | 基于产业互联网平台交易数据的交易会员评分方法及系统 | |
Sari | The Effect Of Murabahah, Musyarakah, And Ijarah Financing On Profitability With Non Performing Financing As A Moderation Variable In Islamic Commercial Banks For The 2016-2020 Period | |
CN115345745A (zh) | 用于黄金珠宝产业的金融风控系统及运行方法 | |
TWM587310U (zh) | 金融商品之潛在購買客群篩選系統 | |
Asimakopoulos et al. | The efficiency of the Greek banking system and its determinants | |
CN115034685A (zh) | 客户价值评估方法、装置和计算机可读存储介质 | |
CN106779843A (zh) | 一种基于客户群体特征的商户竞合关系分析的方法和装置 | |
CN112199360A (zh) | 一种数据的处理方法、装置、设备和介质 | |
CN111612630A (zh) | 一种多品类金融资产账户盈亏计算方法及装置 | |
JP2012238073A (ja) | 債権買取査定支援システム及び債権買取査定支援方法 | |
US20140278751A1 (en) | System and method for identifying rapidly-growing business customers | |
TWI769385B (zh) | 金融商品之潛在購買客群篩選方法及其系統 | |
Chan et al. | Stochastic cost flow system for stock markets with an application in behavioral finance | |
Correa et al. | Dealer Leverage and Exchange Rates: Heterogeneity Across Intermediaries | |
Artikov et al. | Analysis And Optimization Of Product Costs And Expenses In Enterprises |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |