CN111582466A - 模拟神经网络的评分卡配置方法、装置、设备及存储介质 - Google Patents
模拟神经网络的评分卡配置方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111582466A CN111582466A CN202010387510.4A CN202010387510A CN111582466A CN 111582466 A CN111582466 A CN 111582466A CN 202010387510 A CN202010387510 A CN 202010387510A CN 111582466 A CN111582466 A CN 111582466A
- Authority
- CN
- China
- Prior art keywords
- layer
- matrix
- model
- vector
- transformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
- G06N3/065—Analogue means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Biophysics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Neurology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Collating Specific Patterns (AREA)
- Credit Cards Or The Like (AREA)
Abstract
本发明实施例公开了一种模拟神经网络的评分卡配置方法、装置、设备及存储介质。该方法包括:获取预设数据库中的原始数据;基于原始数据构建第一层特征变量并基于第一层特征变量得到第一层三维特征向量;根据第一子模型对第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵;根据第二子模型对第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵;根据第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于入模向量进行评分卡的配置。该方法最后得到的特征向量效果比原始的特征向量效果更好,其开发得到的评分卡模型显著提高了查得率,其特征好坏分度高,经过测试具有跟神经网络几何变换一样的良好效果。
Description
技术领域
本发明属于大数据领域,尤其涉及一种模拟神经网络的评分卡配置方法、装置、设备及存储介质。
背景技术
传统评分卡构造特征变量主要是基于原始数据构造特征向量。特征向量的查得率决定了评分卡有效性,当特征变量查得率过低的时候客户的分数都集中在一个范围内,失去了评分卡的意义。特征查得率成为严重制约评分卡效果的重要因素,当前特征查得率过低唯一的解决办法只有重新使用新的特征开发新的评分卡,但是频繁开发评分卡会导致成本增加。
发明内容
有鉴于此,本发明提供了一种模拟神经网络的评分卡配置方法,能够提高特征查得率。
为解决上述技术问题,本发明采用以下技术方案:
第一方面,本发明提供了一种模拟神经网络的评分卡配置方法,该方法包括:
获取预设数据库中的原始数据;
基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量;
根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵;
根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵;
根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
第二方面,本发明提供了一种模拟神经网络的评分卡配置装置,包括:
原始数据获取模块,用于自数据库中获取原始数据;
矩阵构建模块,用于基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量;
第一变换模块,用于根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵;
第二变换模块,用于根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵;
评分卡配置模块,用于根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
第三方面,本发明提供了一种模拟神经网络的评分卡配置设备,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如前述的模拟神经网络的评分卡配置方法。
第四方面,本发明提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时实现前述的模拟神经网络的评分卡配置方法。
同现有技术相比,本发明提供的模拟神经网络的评分卡配置方法,有益效果在于:最后得到的特征向量效果比原始的特征向量效果更好,其开发得到的评分卡模型显著提高了查得率,其特征好坏分度高,经过测试具有跟神经网络几何变换一样的良好效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见的,下面描述中的附图仅仅是本申请的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例一提供的一种模拟神经网络的评分卡配置方法的流程图;
图2是本发明实施例二提供的一种模拟神经网络的评分卡配置方法的子流程图;
图3是本发明实施例三提供的一种模拟神经网络的评分卡配置装置的结构示意图;
图4是本发明实施例四提供的一种模拟神经网络的评分卡配置设备的结构示意图。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施中的技术方案进行清楚、完整的描述。可以理解的是,此处所描述的具体实施例仅仅是本申请一部分实施例,而不是全部的实施例,仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一层特征向量矩阵称为第二层特征向量矩阵,且类似地,可将第二层特征向量矩阵称为第一层特征向量矩阵。第一层特征向量矩阵和第二层特征向量矩阵两者都是特征向量矩阵,但其不是同一特征向量矩阵。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个特征的组合。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。需要说明的是,当一个部被称为“固定于”另一个部,它可以直接在另一个部上也可以存在居中的部。当一个部被认为是“连接”到另一个部,它可以是直接连接到另一个部或者可能同时存在居中部。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述,只是为了说明的目的,并不表示是唯一的实施方式。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
参见图1,本实施例提供了一种模拟神经网络的评分卡配置方法,适用于针对客户的评分含义的评分卡配置过程,具体的,该方法包括以下步骤:
S110、获取预设数据库中的原始数据。
本实施例提供的评分卡配置方法中,评分卡评分依据主要使用的是能共享的数据,如与某一平台有合作关系的商户共享的数据,如针对用户信用的评分,可以是与银行有合作关系的多个商户的数据。这些数据都存储在预设数据库中,数据仓库中原始数据的数据结构包括:商户信息以及授权获取的客户设备信息等初始信息。
S120、基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量。
在获取了原始数据后,通过原始数据提取相关信息作特征构建第一层特征变量,如针对用户信用的评分,用户的消费信息债务信息等都是构建第一层特征变量的原始数据,与现有技术的不同在于,本实施中在构建第一层特征变量之后,会基于第一层特征变量得到第一层三维特征向量并对其进行类似神经网络变换的操作,这是考虑到仅通过原始数据直接得到的第一层特征变量具有高业务含义,其特征表现性差,基于第一层特征变量得到的评分卡在使用中特征差得率偏低效果不佳,而本实施例中将其构建成一个三维特征向量模拟神经网络进行矩阵转换最终得到的特征向量信息更强,特征好坏分度更高。步骤S130-140就是模拟神经网络进行矩阵转换的过程。
S130、根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵。
步骤S130为模拟神经网络进行的第一次矩阵变换过程,第一层三维特征向量是由具有业务含义、维度粒度小的第一层特征变量组成的,调用第一模型对第一层三维特征向量进行矩阵变换的意义在于对第一层三维特征向量进行降维,这个过程在业务上的含义可以理解为:将第一层三维特征向量转换为具有商户评级含义的第二层特征向量矩阵。本实施例中第一模型为一个根据用户和商户关联关系确定的公式,其可以根据矩阵变换所体现的业务含义具体调整。
S140、根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵。
步骤S140为模拟神经网络进行的第二次矩阵变换过程,第一次矩阵变换过程这是一次降维过程,第以一层特征向量矩阵具备的是商户评级含义,而不是客户评级含义,这不符合评分卡,因此需要对第一层特征向量矩阵进行一次升维过程,得到一个具备客户评级含义的第二层特征向量矩阵,而第二层特征向量矩阵是基于第一层特征向量矩阵变换得到的,第二层特征向量矩阵的特征变量也含有商户信息,并且这些商户信息是由用户信息组成(商户信息由用户信息组对应过程为根据第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵)。这样经过步骤S130和步骤S140后,相当于进行了一次特征缩放过程,其将分散的用户信息经过两次矩阵变换后,所方程具有强烈区分度的特征变量(第二层特征向量矩阵中的特征变量),最终得到的第二层特征向量矩阵其业务含义没有第一层三维特征向量高,特征表现性好,可以根据第二层特征向量矩阵进行后续的评分卡开发过程。
S150、根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
评分卡的开发最终需要得到的是评分卡模型,模型建立会根据实际情况进行选择,比如是否要使用单模型,或者在单模型中各种模型好坏的比较而最终确认。本实施例不限制具体的模型建立过程,其可以直接根据第二层特征向量矩阵实现基于Logistic回归的标准评分卡模型开发,也可以根据第二层特征向量矩阵再次进行对特征向量做重要性筛选再进行评分卡模型开发。
示例性的,步骤S150具体可以包括:根据所述第二层特征向量矩阵,经WOE(weightof evidence)转换和IV(Information Value)测试后,筛选出其中IV值大于特征阈值(一般为0.02)的特征向量作为入模向量,采用卡方分箱方法对入模向量做WOE编码得到WOE编码变量,将WOE编码变量作为模型训练数据入模,采用logistic算法训练出模型特征向量权重,根据所述模型特征向量权重配置评分卡。
WOE的全称是“weight of evidence”,即证据权重。直观上讲,WOE是对原始变量的一种编码形式,要对一个变量进行WOE编码,首先需要把这个变量进行分组处理,即分箱或者离散化,常用离散化的方法有等宽分组,等高分组,或者利用决策树来分组。
IV的全称是“Information value”,可通过woe加权求和得到,衡量自变量对应变量的预测能力。在机器学习的二分类问题中,IV值主要用来对输入变量进行编码和预测能力评估。特征变量IV值的大小即表示该变量预测能力的强弱。IV值的取值范围是[0,正无穷),如果当前分组中只包含响应客户或者未响应客户时,IV=正无穷。
本实施例提供了一种模拟神经网络的评分卡配置方法,通过原始数据构建第一层特征变量并进一步得到第一层三维特征向量,再基于第一层三维特征向量模拟神经网络进行连续两次矩阵变换,实现特征缩放,得到降低了业务含义的第二层特征向量矩阵,最终根据第二层特征向量矩阵进行评分卡的配置得到评分卡模型。该方案开发得到的评分卡模型显著提高了查得率,其特征好坏分度高,经过测试具有跟神经网络几何变换一样的良好效果,最后得到的特征向量效果比原始的特征向量效果更好。
实施例二
实施例二提供了一种模拟神经网络的评分卡配置方法,其与实施例一的区别在于,进一步详细解释了模拟神经网络进行矩阵变换的过程,具体如下:
基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量包括S121-122(图未示):
S121、基于所述原始数据按照多个维度构建第一层特征变量。
本实施例中的多个维度是根据评分卡的实际应用需求而设置的,通常情况下可以由人为选择。
示例性的,在一些实施例中,如图2所示,步骤S121包括S1211-1213:
S1211、构建以客户为主体对象的一级维度,所述一级维度包括用户消费行为、共债情况、黑白名单情况和身份稳定性中的一种或多种。
S1212、对所述一级维度进行细分得到二级维度。
示例性的,如用户消费行为可以细分得到的二级维度为:月消费金额、月消费金额变动率、第一预设时间内消费金额占第二预设时间内消费金额比重以及消费金额是否大于预设金额等;如公债情况可以细分得到的二级维度为:月多头和半年多头等等。
S1213、根据所述二级维度基于所述原始数据构建第一层特征变量。
确定了二级维度后,结合原始数据确定用户的具体情况可以直接构建第一层特征变量。
S122、基于所述第一层特征变量确定第一层三维特征向量X={xi,j,k},其中i为客户标识,j为第一层特征变量标识,k为商户标识。1≤i≤I,I为原始数据中的用户数量,1≤k≤K,K为原始数据中的商户数量,1≤j≤J,J为第一层特征变量的个数。
在确定了第一层特征变量后,将其构建成第一层三维特征向量方便后续模拟神经网络进行矩阵变换,相应的,对步骤S130和步骤S140也做进一步对应解释:
步骤S130根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵包括:
根据所述第一层三维特征变量X={xi,j,k},调取第一子模型进行第一次矩阵变换得到第一层特征向量矩阵Y={yj,k},所述第一子模型中,n表示第一权重,所述第一权重根据预设表格由商户和客户的关系确定。
步骤S140根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵包括:
根据所述第一层特征向量矩阵Y={yj,k},调取第二子模型进行第二次矩阵变换得到第二层特征向量矩阵Z={zi,j},所述第二子模型中。m表示第二权重,所述第二权重根据预设表格由商户和客户的关系确定。第一权重和第二权重都是根据客户和商户之间的额关系确定的,第一权重n是根据每个商户有多少客户确定的,m是根据每个客户与多少商户有交易确定的,具体的可以预先配置一关系数据表格用于根据原始数据确定n和m。
示例性的,模拟神经网络进行矩阵变换的过程可以为:
本实施例提供的一种模拟神经网络的评分卡配置方法,具体给出了如何模拟神经网络进行矩阵变换的过程,实现了特征向量矩阵的先降维再升维,矩阵变换过程中使用的参数n和m随着用户行为发生变化因而是动态的,解决了根据原始数据确定特征变量进行评分卡开发低查得率的问题。
实施例三
图3为本发明实施例三提供的一种模拟神经网络的评分卡配置装置的结构示意图,如图3所述,该装置300包括:
原始数据获取模块310,用于自数据库中获取原始数据。
矩阵构建模块320,用于基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量。
第一变换模块330,用于根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵。
第二变换模块340,用于根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵。
评分卡配置模块350,用于根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
更具体的,矩阵构建模块320具体包括:
第一层特征变量构建单元,用于基于所述原始数据按照多个维度构建第一层特征变量。
第一层三维特征向量构建单元,用于基于所述第一层特征变量确定第一层三维特征向量X={xi,j,k},其中i为客户标识,j为第一层特征变量标识,k为商户标识。
更具体的,第一层特征变量构建单元用于:构建以客户为主体对象的一级维度,所述一级维度包括用户消费行为、共债情况、黑白名单情况和身份稳定性中的一种或多种;对所述一级维度进行细分得到二级维度;根据所述二级维度基于所述原始数据构建第一层特征变量。
更具体的,第一变换模块330,用于根据所述第一层三维特征变量X={xi,j,k},调取第一子模型进行第一次矩阵变换得到第一层特征向量矩阵Y={yj,k},所述第一子模型中,n表示第一权重,所述第一权重根据预设表格由商户和客户的关系确定。
更具体的,第二变换模块340,用于根据所述第一层特征向量矩阵Y={yj,k},调取第二子模型进行第二次矩阵变换得到第二层特征向量矩阵Z={yj,k},所述第二子模型中。m表示第二权重,所述第二权重根据预设表格由商户和客户的关系确定。
更具体的,评分卡配置模块350用于:根据所述第二层特征向量矩阵,经WOE转换和IV测试后,筛选出其中IV值大于0.02的特征向量作为入模向量;采用卡方分箱方法对所述入模向量做WOE编码得到WOE编码变量,将WOE编码变量作为模型训练数据入模,采用logistic算法训练出模型特征向量权重,根据所述模型特征向量权重配置评分卡。
本实施例提供了一种模拟神经网络的评分卡配置装置,最后得到的特征向量效果比原始的特征向量效果更好,其开发得到的评分卡模型显著提高了查得率,其特征好坏分度高,经过测试具有跟神经网络几何变换一样的良好效果。
实施例四
图4为本发明实施例四提供的一种模拟神经网络的评分卡配置设备400的结构示意图,如图4所示,该设备包括存储器410、处理器420,设备中处理器420的数量可以是一个或多个,图4中以一个处理器420为例;设备中的存储器410、处理器420可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的模拟神经网络的评分卡配置方法对应的程序指令/模块(例如,模拟神经网络的评分卡配置装置中的原始数据获取模块310、矩阵构建模块320、第一变换模块330、第一变换模块340和评分卡配置模块350)。处理器420通过运行存储在存储器410中的软件程序、指令以及模块,从而执行模拟神经网络的评分卡配置设备的各种功能应用以及数据处理,即实现上述的模拟神经网络的评分卡配置方法。
其中,所述处理器420用于运行存储在存储器410中的计算机可执行程序,以实现如下步骤:步骤S110、获取预设数据库中的原始数据;步骤S120、基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量;步骤S130、根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵;步骤S140、根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵;步骤S150、根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
当然,本发明实施例所提供的一种模拟神经网络的评分卡配置设备,该设备不限于如上所述的方法操作,还可以执行本发明实施例任意实施例所提供的模拟神经网络的评分卡配置方法中的相关操作。
存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器410可进一步包括相对于处理器420远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本实施例提供了一种模拟神经网络的评分卡配置设备,最后得到的特征向量效果比原始的特征向量效果更好,其开发得到的评分卡模型显著提高了查得率,其特征好坏分度高,经过测试具有跟神经网络几何变换一样的良好效果。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种模拟神经网络的评分卡配置方法,该模拟神经网络的评分卡配置方法包括:
获取预设数据库中的原始数据;
基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量;
根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵;
根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵;
根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的模拟神经网络的评分卡配置方法中的相关操作。
通过以上关于实施方式的描述,所述领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,设备,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述授权装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种模拟神经网络的评分卡配置方法,其特征在于,包括:
获取预设数据库中的原始数据;
基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量;
根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵;
根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵;
根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
2.根据权利要求1所述的方法,其特征在于,所述基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量包括:
基于所述原始数据按照多个维度构建第一层特征变量;
基于所述第一层特征变量确定第一层三维特征向量X={xi,j,k},其中i为客户标识,j为第一层特征变量标识,k为商户标识。
3.根据权利要求2所述的方法,其特征在于,所述基于所述原始数据按照多个维度构建第一层特征变量包括:
构建以客户为主体对象的一级维度,所述一级维度包括用户消费行为、共债情况、黑白名单情况和身份稳定性中的一种或多种;
对所述一级维度进行细分得到二级维度;
根据所述二级维度基于所述原始数据构建第一层特征变量。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量包括:
根据所述第二层特征向量矩阵,经WOE转换和IV测试后,筛选出其中IV值大于特征阈值的特征向量作为入模向量。
7.根据权利要求1所述的方法,其特征在于,所述基于所述入模向量进行评分卡的配置包括:
采用卡方分箱方法对所述入模向量做WOE编码得到WOE编码变量,将WOE编码变量作为模型训练数据入模,采用logistic算法训练出模型特征向量权重,根据所述模型特征向量权重配置评分卡。
8.一种模拟神经网络的评分卡配置装置,其特征在于,包括:
原始数据获取模块,用于自数据库中获取原始数据;
矩阵构建模块,用于基于所述原始数据构建第一层特征变量并基于所述第一层特征变量得到第一层三维特征向量;
第一变换模块,用于根据第一子模型对所述第一层三维特征向量进行第一次矩阵变换得到第一层特征向量矩阵;
第二变换模块,用于根据第二子模型对所述第一层特征向量矩阵进行第二次矩阵变换得到第二层特征向量矩阵;
评分卡配置模块,用于根据所述第二层特征向量矩阵变换模型输出筛选得到入模向量,并基于所述入模向量进行评分卡的配置。
9.一种模拟神经网络的评分卡配置设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的模拟神经网络的评分卡配置方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时,实现如权利要求1-7任意一项所述的模拟神经网络的评分卡配置方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010387510.4A CN111582466B (zh) | 2020-05-09 | 2020-05-09 | 模拟神经网络的评分卡配置方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010387510.4A CN111582466B (zh) | 2020-05-09 | 2020-05-09 | 模拟神经网络的评分卡配置方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582466A true CN111582466A (zh) | 2020-08-25 |
CN111582466B CN111582466B (zh) | 2023-09-01 |
Family
ID=72112131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010387510.4A Active CN111582466B (zh) | 2020-05-09 | 2020-05-09 | 模拟神经网络的评分卡配置方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582466B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050096950A1 (en) * | 2003-10-29 | 2005-05-05 | Caplan Scott M. | Method and apparatus for creating and evaluating strategies |
CN108416495A (zh) * | 2018-01-30 | 2018-08-17 | 杭州排列科技有限公司 | 基于机器学习的评分卡模型建立方法及装置 |
CN109191282A (zh) * | 2018-08-23 | 2019-01-11 | 北京玖富普惠信息技术有限公司 | 一种基于行为模型的贷中监测评分方法以及系统 |
CN109272402A (zh) * | 2018-10-08 | 2019-01-25 | 深圳市牛鼎丰科技有限公司 | 评分卡的建模方法、装置、计算机设备及存储介质 |
CN109636591A (zh) * | 2018-12-28 | 2019-04-16 | 浙江工业大学 | 一种基于机器学习的信用评分卡开发方法 |
CN109858566A (zh) * | 2019-03-01 | 2019-06-07 | 成都新希望金融信息有限公司 | 一种基于多层模型构建增加入模维度的评分卡的方法 |
CN110263973A (zh) * | 2019-05-15 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 预测用户行为的方法及装置 |
CN110929224A (zh) * | 2019-11-15 | 2020-03-27 | 上海电科智能系统股份有限公司 | 基于公交行车安全的安全指标体系创建方法 |
CN111047193A (zh) * | 2019-12-13 | 2020-04-21 | 上海海豚企业征信服务有限公司 | 一种基于信用大数据标签的企业信用评分模型生成算法 |
-
2020
- 2020-05-09 CN CN202010387510.4A patent/CN111582466B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050096950A1 (en) * | 2003-10-29 | 2005-05-05 | Caplan Scott M. | Method and apparatus for creating and evaluating strategies |
CN108416495A (zh) * | 2018-01-30 | 2018-08-17 | 杭州排列科技有限公司 | 基于机器学习的评分卡模型建立方法及装置 |
CN109191282A (zh) * | 2018-08-23 | 2019-01-11 | 北京玖富普惠信息技术有限公司 | 一种基于行为模型的贷中监测评分方法以及系统 |
CN109272402A (zh) * | 2018-10-08 | 2019-01-25 | 深圳市牛鼎丰科技有限公司 | 评分卡的建模方法、装置、计算机设备及存储介质 |
CN109636591A (zh) * | 2018-12-28 | 2019-04-16 | 浙江工业大学 | 一种基于机器学习的信用评分卡开发方法 |
CN109858566A (zh) * | 2019-03-01 | 2019-06-07 | 成都新希望金融信息有限公司 | 一种基于多层模型构建增加入模维度的评分卡的方法 |
CN110263973A (zh) * | 2019-05-15 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 预测用户行为的方法及装置 |
CN110929224A (zh) * | 2019-11-15 | 2020-03-27 | 上海电科智能系统股份有限公司 | 基于公交行车安全的安全指标体系创建方法 |
CN111047193A (zh) * | 2019-12-13 | 2020-04-21 | 上海海豚企业征信服务有限公司 | 一种基于信用大数据标签的企业信用评分模型生成算法 |
Also Published As
Publication number | Publication date |
---|---|
CN111582466B (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110111198A (zh) | 用户金融风险预估方法、装置、电子设备及可读介质 | |
CN112215604B (zh) | 交易双方关系信息识别方法及装置 | |
CN111898839B (zh) | 电力用户的重要程度分类方法及装置 | |
CN109766454A (zh) | 一种投资者分类方法、装置、设备及介质 | |
CN108898476A (zh) | 一种贷款客户信用评分方法和装置 | |
CN112785005B (zh) | 多目标任务的辅助决策方法、装置、计算机设备及介质 | |
CN111062806B (zh) | 个人金融信用风险评价方法、系统和存储介质 | |
CN111476673A (zh) | 基于神经网络的社交网络间用户对齐的方法、装置、介质 | |
CN111127185A (zh) | 信贷欺诈识别模型构建方法及装置 | |
Basak et al. | Understanding cross-sectional dependence in panel data | |
CN115170565A (zh) | 基于自动神经网络架构搜索的图像欺诈检测方法及装置 | |
Nilashi et al. | A comparative study of adaptive neuro fuzzy inferences system (ANFIS) and fuzzy inference system (FIS) approach for trust in B2C electronic commerce websites | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN110399818A (zh) | 一种风险预测的方法和设备 | |
CN113486225A (zh) | 一种基于大数据的企业画像展现方法及系统 | |
CN113570260A (zh) | 任务分配方法和计算机可读存储介质、电子设备 | |
CN116541792A (zh) | 一种基于图神经网络节点分类进行团伙识别的方法 | |
CN117172591A (zh) | 多维度绩效评价方法、装置、计算机设备和存储介质 | |
CN111582466A (zh) | 模拟神经网络的评分卡配置方法、装置、设备及存储介质 | |
CN116805245A (zh) | 基于图神经网络与解耦表示学习的欺诈检测方法及系统 | |
CN111126860A (zh) | 任务分配方法、任务分配装置和电子设备 | |
CN115860554A (zh) | 电站运行状态评估方法、装置、电子设备及存储介质 | |
CN115496364A (zh) | 幌子企业识别方法及装置、存储介质及电子设备 | |
Hou | A Model for Software Selection with Fuzzy Linguistic Information. | |
CN112215441A (zh) | 预测模型训练方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |