CN114418155A - 一种评分卡训练的处理方法、装置、设备及介质 - Google Patents
一种评分卡训练的处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114418155A CN114418155A CN202210064876.7A CN202210064876A CN114418155A CN 114418155 A CN114418155 A CN 114418155A CN 202210064876 A CN202210064876 A CN 202210064876A CN 114418155 A CN114418155 A CN 114418155A
- Authority
- CN
- China
- Prior art keywords
- score
- sample data
- scoring card
- training
- scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 105
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/02—Reservations, e.g. for tickets, services or events
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Technology Law (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种评分卡训练的处理方法,其包括:响应于当前用户的预约指令,对所述预约指令进行文本提取,获取当前用户的样本数据;将所述样本数据作为参数,输入到评分卡训练模型中训练,所述评分卡训练模型中的指标对所述样本数据进行分选,得出第一寄存分数,以反映所述样本数据的评分,所述指标为预先定义的,用于指示所述样本数据在一个取值区域内的分选运算;所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数;推荐所述评分卡分数至当前用户。本发明可以大量的减少人工的参与程度,减少人力成本,通过大数据精准分析的方式优化评分卡的指标,使得评分卡训练更加方便、准确和高效。
Description
技术领域
本申请设计模型训练领域,具体设计一种评分卡训练的处理方法、装置、设备和介质。
背景技术
评分卡技术是一种针对客户信用建立的得分可解释技术,评分卡技术是评分开发和评分应用之间的一道桥梁,评分卡技术将评分开发和评分应用二者连接在一起,利用通俗易懂的数据和语言向评分应用者展示出客户为何得到这个分数,与此同时,评分开发者还可利用评分卡技术分析变量的贡献度,评分卡技术对评分广泛的传播和应用奠定了稳定的基础。
评分卡技术在风控系统应用中,用于对申请者是否满足需求进行筛选应用。但在配置评分卡系统的过程中,对于风控经验业务人员有较高的要求,风控业务人员需要对不同客户的不同数据进行分析,根据不同数据给出不同客户对应的评分卡分数。
发明内容
为了解决评分卡技术需要对不同客户的不同数据分析从而给出评分卡分数的问题,本发明提出一种评分卡训练的处理方法,本发明提出如下的技术方案:
一种评分卡训练的处理方法,其包括:
响应于当前用户的预约指令,对所述预约指令进行文本提取,获取当前用户的样本数据;
将所述样本数据作为参数,输入到评分卡训练模型中训练,所述评分卡训练模型中的指标对所述样本数据进行分选,得出第一寄存分数,以反映所述样本数据的评分,所述指标为预先定义的,用于指示所述样本数据在一个取值区域内的分选运算;
所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数;
推荐所述评分卡分数至当前用户。
在本发明一实施例中,所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数的步骤包括:
所述评分卡训练模型对所述样本数据进行统计,统计所述样本数据落入所述指标的所述取值区域的分布比例,预设所述取值区域对应的分布阈值,以反映所述样本数据于所述取值区域上的分布情况。
在本发明一实施例中,所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数的步骤还包括:
当所述分布比例大于等于所述分布阈值时,将所述取值区域进行拆分得到取值子区域,将所述样本数据按照所述取值子区域对应的指标进行训练。
在本发明一实施例中,所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数的步骤还包括:
当所述分布比例大于等于所述分布阈值时,所述样本数据按照所述取值子区域的指标进行训练得到第二寄存分数,并将第二寄存分数作为评分卡分数;
当所述分布比例小于所述分布阈值时,将第一寄存分数作为评分卡分数。
在本发明一实施例中,所述评分卡训练的处理方法还包括:
对当前用户的所述样本数据和所述评分卡分数进行统计,调整所述指标的数量以优化评分卡训练模型。
在本发明一实施例中,所述评分卡训练模型采用树形结构模型,所述树形结构模型包括有至少两层,其中,每一层的父节点对应的所述指标的所述取值区域相同。
在本发明一实施例中,所述树形结构模型的父节点包括有至少两个子节点,父节点和子节点之间的路径设定为分支,分支对应其父节点所述指标的一个所述取值区域对所述样本数据的分选结果。
本发明还提出一种评分卡训练的处理装置,所述评分卡训练的处理装置包括:
获取单元,用于响应于当前用户的预约指令,对所述预约指令进行文本提取,获取当前用户的样本数据;
训练单元,用于将所述样本数据作为参数,输入到评分卡训练模型中训练,所述评分卡训练模型中的指标对所述样本数据进行分选,得出第一寄存分数,以反映所述样本数据的评分,所述指标为预先定义的,用于指示所述样本数据在一个取值区域内的分选运算;
统计单元,用于将所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数;
输出单元,用于推荐所述评分卡分数至当前用户;
优化单元,用于对当前用户的所述样本数据和所述评分卡分数进行统计,调整所述指标的数量以优化评分卡训练模型。
本发明还提出一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的一种评分卡训练的处理方法。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的一种评分卡训练的处理方法。
本发明提出一种评分卡训练的处理方法、装置、设备及介质,本发明根据当前用户的预约指令获取当前用户的样本数据,将样本数据输入到评分卡训练模型中进行训练得出第一寄存分数,评分卡训练模型对第一寄存分数进行统计并计算出当前用户的评分卡分数,评分卡分数反映当前用户在风控系统中的信用程度。本发明可以大量的减少人工的参与程度,减少人力成本,通过大数据精准分析的方式训练评分卡的指标,使得评分卡训练更加方便、准确和高效。
附图说明
图1为本发明的一种评分卡训练的处理方法的流程示意图;
图2为本发明的一种评分卡训练的处理方法的步骤S30的子步骤流程图;
图3为本发明的一种评分卡训练的处理方法的功能模块图;
图4为本发明的一种评分卡训练的处理方法的电子设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
如图1所示,是本发明一种评分卡训练的处理方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述一种评分卡训练的处理方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(DigitalSignal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
请参阅图1~2,本发明提出一种评分卡训练的处理方法、装置、设备及介质,在一些实施例中,一种评分卡训练的处理方法,包括:
步骤S10、响应于当前用户的预约指令,对所述预约指令进行文本提取,获取当前用户的样本数据。
当前用户可进行评分卡的预约指令,根据当前用户的预约指令获取当前用户的样本数据。在对所述预约指令进行所述样本数据提取时,根据当前用户预约指令的文件格式采用相应的文本提取流程进行样本数据的提取,以获取所述预约指令中的所述样本数据,文件格式例如可以采用pdf格式,jpg、png等图片格式,或者word格式。其中,所述预约指令中提取出的所述样本数据的种类不加以限制,例如,当前用户的所述样本数据可包括有年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等。例如,针对pdf格式的所述预约指令,可使用开源、基于java的、支持pdf文档生成的apache pdfbox工具库,提取所述用户预约指令中的整份报告或报告中的某页的文本信息。针对jpg、png等图片格式的所述预约指令,可使用ocr技术提取预约指令中的样本数据等信息。针对word格式的所述预约指令,可使用poi、poi-ooxml或poi-scratchpad框架提取当前用户的所述预约指令中的所述样本数据。其中,当前用户的预约指令中提取的所述样本数据可包括年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等。
例如,在从当前用户的预约指令中提取性别时,性别比较固定,一般直接写男女,也需要考虑尊称,另外也会标注“姓名”定位词,可使用以下的正则表达式进行提取:(?<=年龄[::]).*(?=岁)|\d.*(?=岁)。在从当前用户的预约指令中提取学历、子女个数等时,也可用定位词“学历”、“子女个数”等定位词,再结合正则表达式进行提取。
当出现同一个当前用户提交有多次的评分预约指令时,可能出现当前用户在前面提交预约指令时出现信息填写错误的情况,此时,则可以根据提交评分预约指令的提交时间,选择评分预约时间中最晚的一个作为选定的预约指令,并且根据选定的预约指令进行所述样本数据的提取。
步骤S20、将所述样本数据作为参数,输入到评分卡训练模型中训练,所述评分卡训练模型中的指标对所述样本数据进行分选,得出第一寄存分数,以反映所述样本数据的评分,所述指标为预先定义的,用于指示所述样本数据在一个取值区域内的分选运算。
所述取值区域可分成两个互斥的取值区域区间,两个互斥的取值区域区间可分别对将符合其取值范围的所述样本数据进行分选选取。其中,所述评分卡训练模型采用树形结构模型。
在本实施例中,将当前用户的年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等信息作为参数,输入到训练好的树形结构模型中训练,得到第一寄存分数,其中,第一寄存分数的具体取值范围不加以限制,在一些实施例中,可将第一寄存分数设置为0至100或者0-150,第一寄存分数的设置顺序不加以限制,例如,第一寄存分数可设置为0至100,第一寄存分数可呈等差数列进行排序,第一寄存分数可按照从小到大的顺序进行排列。
所述树形结构模型包括有至少两层,其中,每一层的父节点对应的所述指标的所述取值区域相同。所述树形结构模型中可包括有多个所述指标。具体地,在将当前用户的所述样本数据做为参数输入到训练好的树形结构模型中时,可以对当前用户的所述样本数据(年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等信息)进行归一化的处理,然后将归一化处理后的预约指令中的样本数据输入到训练好的树形结构模型中获得第一寄存分数,并且根据第一寄存分数进行分析,第一寄存分数反映所述样本数据的评分。
作为示例,在进行归一化时,例如可采用如下方式进行:
每月收入:以元为单位,(x-4500)/25500;
年龄:(x-16)/80;
学历:本科取值为1,专科取值为-1;
需要说明的是,归一化也可采用其他合适的方式进行,并不限于上述的归一化公式,另外也可通过其他的处理方式,不限于归一化公式对样本数据(年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等信息)进行数据的处理。
需要说明的是,在本发明中,树形结构模型采用结构化设计,可以避免所述取值区域出现重复选取的结果。
在实施例中,所述评分卡训练模型可采用树形结构模型的内部网络层依次设置的输入层、两个或者更多个隐藏层及输出层,层与层之间是全连接的,即第i层的一个输出层一定与第i+1层的其中一个输入层相连接。
所述树形结构模型可以以当前用户的所述样本数据作为参数,参与到评分卡训练模型的权重计算中,来获取当前用户的第一寄存分数。例如可将当前用户的样本数据的其中一个参数,例如可将当前用户的每月收入作为权重最高的参数,将所述每月收入参与到评分卡训练模型中进行训练,从而得出所述每月收入作为最高权重的第一寄存分数。或者可将当前用户的样本数据中的其中几个参数作为重要的参数,按照一定的权重参与到评分卡训练模型中进行训练,例如可将每月收入、子女个数、学历、近三个月信用卡消费金额按照3:3:3:1的权重,参阅到评分卡训练模型中进行训练,从而得出在每月收入、子女个数、学历权重较高的情况下的第一寄存分数。
在本实施例中,树形结构模型的训练过程是以评分卡训练模型中所有当前用户的预约指令中的所述样本数据作为数据集,自动学习年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等信息和第一寄存分数之间的关联性。
在所述树形结构模型中,定义指标,所述指标为所述样本数据在一个取值区域内的分选运算,所述分选的条件为可将所述取值区域分成两个互斥的取值区域区间,两个互斥的取值区域区间分别对将符合其取值范围的所述样本数据进行选取。其中,将所述取值区域分选成两个互斥的取值区域区间的具体分选方式不加以限制,在一些实施例中,可将取值区域分成两段连续的取值区域区间,也可将取值区域分成两段不连续的取值区域区间。其中,两段取值区域区间对应的取值范围的长度不加以限制,可将两段取值区域区间对应的取值范围的长度设置相等,例如,可将取值区域设置成两段取值区域区间,两段取值区域区间对应的取值范围的长度不同。
在树形结构模型中,可包括有多个父节点,每个父节点可包括有至少两个子节点,父节点和子节点之间的路径称为分支,每个分支可对应其父节点所述指标的一个所述取值区域区间对所述样本数据的选取结果。每个父节点和每个子节点可对应的设置有不同的指标,其中,每一层的节点对应的所述指标的所述取值区域相同。
例如,父节点的所述指标为所述样本数据在[0,50]取值区域内的分选运算,其中所述样本数据被所述取值区域内的数据所包含,所述分选的条件可为将所述取值区域[0,50]分成两个互斥的取值区域区间,两个互斥的取值区域区间可分别为[0,20)和[20,50],两个互斥的取值区域区间分别对符合其取值范围的所述样本数据进行选取,其中父节点和子节点之间的两个分支,可分别对应两个取值区域区间[0,20)和[20,50]对所述样本数据的选取结果,并且父节点对应的取值区域对所述样本数据的选取结果传递至子节点,子节点对应的指标可进行对所述样本数据的再次分选。
在一些实施例中,在树形结构模型中,所述树形结构模型的树的深度可为n时,可对应的将当前用户的所述样本数据定义为一个样本数组m,该样本数组m可为一个具有n个元素序列的集合,其中,年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等信息可作为数组m的元素,年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等信息的具体排列顺序不加以限制,将年龄、学历、子女个数、每月收入、近三个月信用卡消费金额、贷款总金额等信息的具体的排列顺序与n个指标相对应即可。例如,一个当前用户的所述样本数组为m1,其中样本数组m1可为(m11,m12,……m1n)的数组集合,m11对应的是树形结构模型的树第一层的所述指标的分选计算,m12对应的是所述树形结构模型的树第二层的所述指标的分选计算,m1n对应的是所述树形结构模型的树第n层的所述指标的分选计算。
所述树形结构模型的树的叶子节点可对应的设置有第一寄存分数,其中,第一寄存分数的可根据叶子节点的数量进行设置,例如,第一寄存分数可设置为0至100,第一寄存分数可根据叶子节点的数量呈等差数列进行排序,第一寄存分数可按照从小到大的顺序进行排列。
步骤S30、所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数。
步骤S30可包括有步骤S31、步骤S32、步骤S33,其中
步骤S31、所述评分卡训练模型对所述样本数据进行统计,统计所述样本数据落入所述指标的所述取值区域的分布比例,预设所述取值区域对应的分布阈值,以反映所述样本数据于所述取值区域上的分布情况。
步骤S32、判断所述分布比例是否大于所述分布阈值,当所述分布比例大于等于所述分布阈值时,将所述取值区域进行拆分得到取值子区域,将所述样本数据按照所述取值子区域对应的指标进行训练;当所述分布比例小于所述分布阈值时,不对所述取值区域进行拆分。
步骤S33、所述评分卡训练模型计算出评分卡分数。
所述评分卡训练模型对所述样本数据进行统计,将所述样本数据落入所述指标下的所述取值区域的分布情况计算出相应的分布比例;预设该所述指标对应的分布阈值。当所述分布比例大于等于所述分布阈值时,将所述取值区域进行拆分得到取值子区域;当所述分布比例小于所述分布阈值时,不对所述取值区域进行拆分,将第一寄存分数作为评分卡分数。当所述分布比例大于等于所述分布阈值时,所述样本数据按照所述取值子区域的指标进行训练得到第二寄存分数,将所述样本数据按照修改后的指标进行训练,得到指标修改后的第二寄存分数,并将指标修改后的第二寄存分数作为评分卡分数。
在树形结构模型中,在同一个所述指标的分选运算中,会存在该指标的一个所述取值区域对所述样本数组的元素的选取范围大于该指标的另一个所述取值区域对所述样本数组的选取范围,当所述样本数组在两个不同的取值区域的选取范围差别较大时,容易导致第一寄存分数过于集中,从而较难对不同的用户的所述样本数据进行区分。
因此,对于一个具体的所述指标n,将所述样本数据落入指标n对应的所述取值子区域的分布情况计算出相应的分布比例;预设该指标n对应的分布阈值ln,当所述分布比例大于等于所述分布阈值ln时,将所述取值区域进行拆分得到取值子区域;当所述分布比例小于所述分布阈值时,不对所述取值子区域进行拆分。
其中取值子区域的拆分范围不加以限制,在一些实施例中,取值子区域的取值范围,可参照该指标n对应父节点的另一分支的取值范围进行等分拆分,并且按照拆分出的取值范围增加对应的分支和子节点,并且,对于叶子节点的数量也相应的进行增加,将拆分后增加的分支和子节点对应增加的叶子节点设定为第二寄存分数,第二寄存分数按照拆分前的第一寄存分数按照平均梯度进行赋值。
如果存在多个来自相同祖先节点的分支满足阈值拆分要求,可对他们的相同祖先节点进行所述指标的取值区域进行拆分,例如,当父节点和子节点对应的所述指标的取值区域都需要进行拆分时,可对父节点对应的所述指标的取值区域进行拆分。
将所述样本数据按照修改后的指标进行训练,得到指标修改后的第二寄存分数,并将指标修改后的第二寄存分数作为评分卡分数。
步骤S40、推荐所述评分卡分数至当前用户。
所述评分卡训练模型对当前用户的所述样本数据进行训练后,得到评分卡分数,将评分卡分数发送至当前用户,同时还可将评分卡分数所对应的当前用户是否满足评分卡训练模型所要求的标准发送至当前用户,例如,评分卡分数可设置为[0,100],当评分卡分数落入至[50,75]的范围内可作为满足评分卡训练模型所要求的标准,当评分卡分数落入至[0,50)和(75,100]的范围内可作为不满足评分卡训练模型所要求的标准。
步骤S50、对当前用户的所述样本数据和所述评分卡分数进行统计,调整所述指标的数量以优化评分卡训练模型。
随着训练的当前用户的所述样本数据的逐渐增加,评分卡训练模型需要进行不断的优化和学习,在树形结构模型中,可以分析出各个指标的分选结果所对应的所述样本数据以及评分卡分数的分布情况,例如,当目前的树形结构模型中的某些所述指标对应的分选效果不理性的情况下,可通过删除该指标进行优化树形结构模型,当目前的树形结构模型的分选效果对应的评分卡分数较为集中的情况下,可通过增加更多的指标,从而实现树形结构模型的优化。
需要说明的是,在本发明中,为了进一步保证数据的安全性,还可以将涉及到的数据及模型部署于区块链,以防止数据被恶意篡改。
需要说明的是,上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包含相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
如图3所示,是本发明一种评分卡训练的处理装置的功能模块图。所述一种评分卡训练的处理装置11包括有获取单元110、训练单元111、统计单元112、输出单元113和优化单元114,本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。
步骤S10、响应于当前用户的预约指令,对所述预约指令进行文本提取,获取单元110获取当前用户的样本数据。
步骤S20、将所述样本数据作为参数,输入到评分卡训练模型中训练单元111进行训练,所述评分卡训练模型中的指标对所述样本数据进行分选,得出第一寄存分数,以反映所述样本数据的评分,所述指标为预先定义的,用于指示所述样本数据在一个取值区域内的分选运算。
步骤S30、所述评分卡训练模型统计单元112对所述第一寄存分数进行统计并计算出评分卡分数。
其中步骤S30可包括如下的子步骤。
步骤S31、所述评分卡训练模型对所述样本数据进行统计,统计所述样本数据落入所述指标的所述取值区域的分布比例,预设所述取值区域对应的分布阈值,以反映所述样本数据于所述取值区域上的分布情况。
步骤S32、判断所述分布比例是否大于所述分布阈值,当所述分布比例大于等于所述分布阈值时,将所述取值区域进行拆分得到取值子区域,将所述样本数据按照所述取值子区域对应的指标进行训练;当所述分布比例小于所述分布阈值时,不对所述取值区域进行拆分。
步骤S33、所述评分卡训练模型计算出评分卡分数。
步骤S40、输出单元113推荐所述评分卡分数至当前用户。
步骤S50、优化单元114对当前用户的所述样本数据和所述评分卡分数进行统计,调整所述指标的数量以优化评分卡训练模型。
如图4所示,是本发明实现一种评分卡训练的处理方法的较佳实施例的电子设备的结构示意图。
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如分布式数据的合并程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,所述电子设备1既可以是总线型结构,也可以是星形结构,所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于方向检测的文字识别程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于方向检测的文字识别程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于方向检测的文字识别方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成获取单元110、训练单元111、统计单元112、输出单元113和优化单元114。
图4仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明,本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案,例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
除说明书所述的技术特征外,其余技术特征为本领域技术人员的已知技术,为突出本发明的创新特点,其余技术特征在此不再赘述。
Claims (10)
1.一种评分卡训练的处理方法,其特征在于,其包括:
响应于当前用户的预约指令,对所述预约指令进行文本提取,获取当前用户的样本数据;
将所述样本数据作为参数,输入到评分卡训练模型中训练,所述评分卡训练模型中的指标对所述样本数据进行分选,得出第一寄存分数,以反映所述样本数据的评分,所述指标为预先定义的,用于指示所述样本数据在一个取值区域内的分选运算;
所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数;
推荐所述评分卡分数至当前用户。
2.根据权利要求1所述的一种评分卡训练的处理方法,其特征在于,所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数的步骤包括:
所述评分卡训练模型对所述样本数据进行统计,统计所述样本数据落入所述指标的所述取值区域的分布比例,预设所述取值区域对应的分布阈值,以反映所述样本数据于所述取值区域上的分布情况。
3.根据权利要求2所述的一种评分卡训练的处理方法,其特征在于,所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数的步骤还包括:
当所述分布比例大于等于所述分布阈值时,将所述取值区域进行拆分得到取值子区域,将所述样本数据按照所述取值子区域对应的指标进行训练。
4.根据权利要求3所述的一种评分卡训练的处理方法,其特征在于,所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数的步骤还包括:
当所述分布比例大于等于所述分布阈值时,所述样本数据按照所述取值子区域的指标进行训练得到第二寄存分数,并将第二寄存分数作为评分卡分数;
当所述分布比例小于所述分布阈值时,将第一寄存分数作为评分卡分数。
5.根据权利要求1所述的一种评分卡训练的处理方法,其特征在于,所述评分卡训练的处理方法还包括:
对当前用户的所述样本数据和所述评分卡分数进行统计,调整所述指标的数量以优化评分卡训练模型。
6.根据权利要求1所述的一种评分卡训练的处理方法,其特征在于,所述评分卡训练模型采用树形结构模型,所述树形结构模型包括有至少两层,其中,每一层的父节点对应的所述指标的所述取值区域相同。
7.根据权利要求6所述的一种评分卡训练的处理方法,其特征在于,所述树形结构模型的父节点包括有至少两个子节点,父节点和子节点之间的路径设定为分支,分支对应其父节点所述指标的一个所述取值区域对所述样本数据的分选结果。
8.一种评分卡训练的处理装置,其特征在于,所述评分卡训练的处理装置包括:
获取单元,用于响应于当前用户的预约指令,对所述预约指令进行文本提取,获取当前用户的样本数据;
训练单元,用于将所述样本数据作为参数,输入到评分卡训练模型中训练,所述评分卡训练模型中的指标对所述样本数据进行分选,得出第一寄存分数,以反映所述样本数据的评分,所述指标为预先定义的,用于指示所述样本数据在一个取值区域内的分选运算;
统计单元,用于将所述评分卡训练模型对所述第一寄存分数进行统计并计算出评分卡分数;
输出单元,用于推荐所述评分卡分数至当前用户;
优化单元,用于对当前用户的所述样本数据和所述评分卡分数进行统计,调整所述指标的数量以优化评分卡训练模型。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的一种评分卡训练的处理方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的一种评分卡训练的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210064876.7A CN114418155A (zh) | 2022-01-20 | 2022-01-20 | 一种评分卡训练的处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210064876.7A CN114418155A (zh) | 2022-01-20 | 2022-01-20 | 一种评分卡训练的处理方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114418155A true CN114418155A (zh) | 2022-04-29 |
Family
ID=81275139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210064876.7A Pending CN114418155A (zh) | 2022-01-20 | 2022-01-20 | 一种评分卡训练的处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114418155A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194803A (zh) * | 2017-05-19 | 2017-09-22 | 南京工业大学 | 一种p2p网贷借款人信用风险评估的装置 |
CN110852443A (zh) * | 2019-09-26 | 2020-02-28 | 支付宝(杭州)信息技术有限公司 | 特征稳定性检测方法、设备及计算机可读介质 |
CN111080437A (zh) * | 2019-05-31 | 2020-04-28 | 北京东方融信达软件技术有限公司 | 金融主客体动态信用评估方法及装置 |
CN111401759A (zh) * | 2020-03-20 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN112232944A (zh) * | 2020-09-29 | 2021-01-15 | 中诚信征信有限公司 | 一种评分卡创建方法、装置和电子设备 |
CN113127333A (zh) * | 2019-12-31 | 2021-07-16 | 中移互联网有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
CN113222177A (zh) * | 2021-05-11 | 2021-08-06 | 支付宝(杭州)信息技术有限公司 | 模型迁移方法、装置及电子设备 |
-
2022
- 2022-01-20 CN CN202210064876.7A patent/CN114418155A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194803A (zh) * | 2017-05-19 | 2017-09-22 | 南京工业大学 | 一种p2p网贷借款人信用风险评估的装置 |
CN111080437A (zh) * | 2019-05-31 | 2020-04-28 | 北京东方融信达软件技术有限公司 | 金融主客体动态信用评估方法及装置 |
CN110852443A (zh) * | 2019-09-26 | 2020-02-28 | 支付宝(杭州)信息技术有限公司 | 特征稳定性检测方法、设备及计算机可读介质 |
CN113127333A (zh) * | 2019-12-31 | 2021-07-16 | 中移互联网有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
CN111401759A (zh) * | 2020-03-20 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
WO2021184825A1 (zh) * | 2020-03-20 | 2021-09-23 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN112232944A (zh) * | 2020-09-29 | 2021-01-15 | 中诚信征信有限公司 | 一种评分卡创建方法、装置和电子设备 |
CN113222177A (zh) * | 2021-05-11 | 2021-08-06 | 支付宝(杭州)信息技术有限公司 | 模型迁移方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
纳伊姆•西央迪奇: "《智能信用评分:创建和实施更好的信用风险评分卡 第2版》", 31 January 2021, 东北财经大学出版社, pages: 8 - 9 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
WO2017190610A1 (zh) | 目标用户定向方法、装置和计算机存储介质 | |
CN109614550A (zh) | 舆情监控方法、装置、计算机设备及存储介质 | |
CN109783632A (zh) | 客服信息推送方法、装置、计算机设备及存储介质 | |
CN112380859A (zh) | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 | |
US9483740B1 (en) | Automated data classification | |
CN106664463A (zh) | 任意大小内容条目生成 | |
CN110134845A (zh) | 项目舆情监控方法、装置、计算机设备及存储介质 | |
US20140297628A1 (en) | Text Information Processing Apparatus, Text Information Processing Method, and Computer Usable Medium Having Text Information Processing Program Embodied Therein | |
CN109858965A (zh) | 一种用户识别方法和系统 | |
CN110598095B (zh) | 一种识别包含指定信息文章的方法、装置及存储介质 | |
CN115146865A (zh) | 基于人工智能的任务优化方法及相关设备 | |
CN110163683B (zh) | 价值用户关键指标确定方法、广告投放方法及装置 | |
CN115002200A (zh) | 基于用户画像的消息推送方法、装置、设备及存储介质 | |
CN113360768A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
CN114037545A (zh) | 客户推荐方法、装置、设备及存储介质 | |
CN113051480A (zh) | 资源推送方法、装置、电子设备及存储介质 | |
CN114398560B (zh) | 基于web平台的营销界面设置方法、装置、设备及介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN114996486A (zh) | 一种数据推荐方法、装置、服务器以及存储介质 | |
CN111369294A (zh) | 软件造价估算方法及装置 | |
US20220408155A1 (en) | System and method for providing media content | |
CN114418155A (zh) | 一种评分卡训练的处理方法、装置、设备及介质 | |
CN115099868A (zh) | 一种基于游客行为数据的采集方法及装置 | |
CN115587244A (zh) | 一种用户兴趣维度采集与推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |