CN112613985A - 一种信用评估模型的数据处理方法及终端 - Google Patents
一种信用评估模型的数据处理方法及终端 Download PDFInfo
- Publication number
- CN112613985A CN112613985A CN202011574842.XA CN202011574842A CN112613985A CN 112613985 A CN112613985 A CN 112613985A CN 202011574842 A CN202011574842 A CN 202011574842A CN 112613985 A CN112613985 A CN 112613985A
- Authority
- CN
- China
- Prior art keywords
- data
- numerical
- type
- missing
- numerical data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013210 evaluation model Methods 0.000 title claims abstract description 41
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000010606 normalization Methods 0.000 claims abstract description 10
- 238000013500 data storage Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种信用评估模型的数据处理方法及终端,包括:S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;S2、对所述第二数值数据进行归一化处理得到第三数值数据;S3、将第一非数值类型的第一非数值数据转化为离散变量;S4、获取缺失数据,判断所述缺失数据的数据类型;若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。通过对数据进行处理,保证评估模型能够成功检测并且进行评估。
Description
技术领域
本发明涉及信用评估技术领域,尤其涉及一种信用评估模型的数据处理方法及终端。
背景技术
目前,市面上的个人借贷软件较多,不同软件面向的目标人群不同。为了降低风险,需要对用户的还款能力进行评估,为了准确锁定目标客户,需要对用户的借贷倾向进行评估。
但是,在实际应用过程中,借贷平台大数据适合数据分析师的应用。如果在信用评估模型中发生了一些缺失,该模型可能无法成功检测,然后对借款人产生偏倚的估计。对于初期样本少,若用户数据信息不全、数据缺失,则无法构建合适的评估模型进行评估,且前期数据没有进行处理,在后期评估过程中需要非常复杂的运算,导致评估结果的精度无法得到保证。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种信用评估模型的数据处理方法及终端,能够提前对用户数据进行处理,保证后续评估结果的精度。
(二)技术方案
为了达到上述目的,本发明采用的一种技术方案为:一种信用评估模型的数据处理方法,包括:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
本发明采用的另一种技术方案为:一种信用评估模型的数据处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
(三)有益效果
本发明的有益效果是:能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
附图说明
图1为本发明的信用评估模型的数据处理方法的流程图;
图2为本发明的信用评估模型的数据处理方法的结构示意图;
【附图标记说明】
1、一种信用评估模型的数据处理终端;2、存储器;3、处理器。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
请参照图1所示,一种信用评估模型的数据处理方法,包括:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
从上述描述可知,本发明的有益效果在于:能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
进一步地,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
进一步地,所述S2包括:
若X第二=Xmin,则X第三=0,若X第二=Xmax,则X第三=1;
若Xmin<X第二<Xmax,则X第三=(X第二-Xmin)/(Xmax-Xmin);
其中,Xmax为第二数值数据中的最大值,Xmin为第二数值数据中的最小值,X第二为其中一个第二数值数据,X第三为X第二归一化处理得到的第三数值数据。
从上述描述可知,经过上述的归一化处理,方便后续构建的评估模型进行运算。
进一步地,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
从上述描述可知,例如第一非数值类型的第一非数值数据为判断有无网贷记录,若有,则将该第一非数值数据转化的离散变量为1,若无,第一非数值数据转化的离散变量为0,以便于后续构建的评估模型进行运算。
进一步地,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
从上述描述可知,例如,定义的数据存储时间段为13个月,则保持更新13个月内的用户数据,避免数据库内的历史存储数据过多导致数据库出现冗余问题,另外,用户可根据需求自行选择多长时间的数据进行评估,灵活性高。
请参照图2所示,一种信用评估模型的数据处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
从上述描述可知,本发明的有益效果在于:能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
进一步地,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
进一步地,所述S2包括:
若X第二=Xmin,则X第三=0,若X第二=Xmax,则X第三=1;
若Xmin<X第二<Xmax,则X第三=(X第二-Xmin)/(Xmax-Xmin);
其中,Xmax为第二数值数据中的最大值,Xmin为第二数值数据中的最小值,X第二为其中一个第二数值数据,X第三为X第二归一化处理得到的第三数值数据。
从上述描述可知,经过上述的归一化处理,方便后续构建的评估模型进行运算。
进一步地,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
从上述描述可知,例如第一非数值类型的第一非数值数据为判断有无网贷记录,若有,则将该第一非数值数据转化的离散变量为1,若无,第一非数值数据转化的离散变量为0,以便于后续构建的评估模型进行运算。
进一步地,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
从上述描述可知,例如,定义的数据存储时间段为13个月,则保持更新13个月内的用户数据,避免数据库内的历史存储数据过多导致数据库出现冗余问题,另外,用户可根据需求自行选择多长时间的数据进行评估,灵活性高。
实施例一
请参照图1所示,一种信用评估模型的数据处理方法,包括:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
其中,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
其中,所述S2包括:
若X第二=Xmin,则X第三=0,若X第二=Xmax,则X第三=1;
若Xmin<X第二<Xmax,则X第三=(X第二-Xmin)/(Xmax-Xmin);
其中,Xmax为第二数值数据中的最大值,Xmin为第二数值数据中的最小值,X第二为其中一个第二数值数据,X第三为X第二归一化处理得到的第三数值数据。
其中,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
其中,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
实施例二
请参照图2,一种信用评估模型的数据处理终端1,包括存储器2、处理器3及存储在存储器2上并可在处理器3上运行的计算机程序,所述处理器3执行所述计算机程序时实现实施例一中的步骤。
综上所述,本发明提供的一种信用评估模型的数据处理终端,能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种信用评估模型的数据处理方法,其特征在于,包括:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
2.根据权利要求1所述的信用评估模型的数据处理方法,其特征在于,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
3.根据权利要求1所述的信用评估模型的数据处理方法,其特征在于,所述S2包括:
若X第二=Xmin,则X第三=0,若X第二=Xmax,则X第三=1;
若Xmin<X第二<Xmax,则X第三=(X第二-Xmin)/(Xmax-Xmin);
其中,Xmax为第二数值数据中的最大值,Xmin为第二数值数据中的最小值,X第二为其中一个第二数值数据,X第三为X第二归一化处理得到的第三数值数据。
4.根据权利要求1所述的信用评估模型的数据处理方法,其特征在于,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
5.根据权利要求1所述的信用评估模型的数据处理方法,其特征在于,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
6.一种信用评估模型的数据处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
7.根据权利要求6所述的信用评估模型的数据处理终端,其特征在于,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
8.根据权利要求6所述的信用评估模型的数据处理终端,其特征在于,所述S2包括:
若X第二=Xmin,则X第三=0,若X第二=Xmax,则X第三=1;
若Xmin<X第二<Xmax,则X第三=(X第二-Xmin)/(Xmax-Xmin);
其中,Xmax为第二数值数据中的最大值,Xmin为第二数值数据中的最小值,X第二为其中一个第二数值数据,X第三为X第二归一化处理得到的第三数值数据。
9.根据权利要求6所述的信用评估模型的数据处理终端,其特征在于,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
10.根据权利要求6所述的信用评估模型的数据处理终端,其特征在于,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011574842.XA CN112613985A (zh) | 2020-12-28 | 2020-12-28 | 一种信用评估模型的数据处理方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011574842.XA CN112613985A (zh) | 2020-12-28 | 2020-12-28 | 一种信用评估模型的数据处理方法及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112613985A true CN112613985A (zh) | 2021-04-06 |
Family
ID=75248089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011574842.XA Pending CN112613985A (zh) | 2020-12-28 | 2020-12-28 | 一种信用评估模型的数据处理方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112613985A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117114728A (zh) * | 2023-08-18 | 2023-11-24 | 广东数鼎科技有限公司 | 一种车辆版型特征补充方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194803A (zh) * | 2017-05-19 | 2017-09-22 | 南京工业大学 | 一种p2p网贷借款人信用风险评估的装置 |
CN111028944A (zh) * | 2019-12-16 | 2020-04-17 | 南昌大学第二附属医院 | 一种基于核主成分分析和多项式特征的脑血管病神经功能损伤程度预测模型 |
KR102156757B1 (ko) * | 2019-09-27 | 2020-09-16 | (주)데이터리퍼블릭 | 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램 |
-
2020
- 2020-12-28 CN CN202011574842.XA patent/CN112613985A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194803A (zh) * | 2017-05-19 | 2017-09-22 | 南京工业大学 | 一种p2p网贷借款人信用风险评估的装置 |
KR102156757B1 (ko) * | 2019-09-27 | 2020-09-16 | (주)데이터리퍼블릭 | 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램 |
CN111028944A (zh) * | 2019-12-16 | 2020-04-17 | 南昌大学第二附属医院 | 一种基于核主成分分析和多项式特征的脑血管病神经功能损伤程度预测模型 |
Non-Patent Citations (2)
Title |
---|
姜明辉: "商业银行个人信用评估组合预测方法研究", 《中国优秀博硕士学位论文全文数据库(博士)》 * |
迈克尔•贝里: "《高管商学院 数据挖掘》", 31 October 2004 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117114728A (zh) * | 2023-08-18 | 2023-11-24 | 广东数鼎科技有限公司 | 一种车辆版型特征补充方法及装置 |
CN117114728B (zh) * | 2023-08-18 | 2024-01-30 | 广东数鼎科技有限公司 | 一种车辆版型特征补充方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7660811B2 (en) | System that facilitates database querying | |
TW201737115A (zh) | 一種機器學習系統的訓練方法和訓練系統 | |
US20160335551A1 (en) | Optimization of fraud detection strategies | |
CN115630045B (zh) | 基于人工智能的数据溯源追踪方法及ai系统 | |
CN112613985A (zh) | 一种信用评估模型的数据处理方法及终端 | |
CN117574907A (zh) | 任务执行方法及装置 | |
CN117454190A (zh) | 日志数据分析方法和装置 | |
WO2023050649A1 (zh) | 基于数据补全的esg指数确定方法及相关产品 | |
CN115129590A (zh) | 一种测试用例的生成方法及装置、电子设备、存储介质 | |
CN113010550B (zh) | 结构化数据的批处理对象生成、批处理方法和装置 | |
CN115203300A (zh) | 一种数据验证方法及装置 | |
CN112488528A (zh) | 数据集的处理方法、装置、设备和存储介质 | |
CN116975517B (zh) | 部分加权随机选取策略的稀疏恢复方法及系统 | |
CN110045985B (zh) | 一种Targetlink模型标定参数设置方法、装置、设备及介质 | |
US11830081B2 (en) | Automated return evaluation with anomoly detection | |
KR102557800B1 (ko) | 차분 프라이버시 기반 의사결정 트리 생성 방법 및 장치 | |
US20230045574A1 (en) | Automated calculation predictions with explanations | |
CN114154108A (zh) | 一种基于计算层次的嵌套公式计算方法 | |
CN116011439A (zh) | 一种算法引擎的优化方法、装置、设备和存储介质 | |
CN118134644A (zh) | 信用评估方法、装置、计算机设备、存储介质和产品 | |
CN114092224A (zh) | 大数据分析方法及装置 | |
CN117171030A (zh) | 软件运行环境检测方法、装置、设备及存储介质 | |
CN117009004A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN117608561A (zh) | 一种新增重复代码的确定方法及装置 | |
Byrne et al. | Accounting for Employee Stock Options: Accelerating Convergence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210406 |