CN114549182A - 目标特征簇的生成方法、装置、终端及存储介质 - Google Patents
目标特征簇的生成方法、装置、终端及存储介质 Download PDFInfo
- Publication number
- CN114549182A CN114549182A CN202210174447.5A CN202210174447A CN114549182A CN 114549182 A CN114549182 A CN 114549182A CN 202210174447 A CN202210174447 A CN 202210174447A CN 114549182 A CN114549182 A CN 114549182A
- Authority
- CN
- China
- Prior art keywords
- target
- feature
- information
- atomic function
- credit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/908—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Library & Information Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Algebra (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种目标特征簇的生成方法、装置、终端及存储介质。方法包括:接收征信报告,基于征信报告,确定信贷风控的特征信息,然后基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数,再基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇。本发明通过预设的范式化特征生成模型对信贷风控的特征信息进行分类,得到不同类型的目标原子函数,然后经预设的范式化特征组合方式将不同类型的目标原子函数进行组合,范式化产出大批量、高覆盖率的信贷特征,不仅提高了信贷特征的生成效率,还拓宽了目标特征簇的维度、覆盖面。
Description
技术领域
本申请涉及金融风控技术领域,具体而言,涉及一种目标特征簇的生成方法、装置、终端及存储介质。
背景技术
在金融风控领域,个人征信报告包含了表征个人信用状况的数据,如个人信贷数据中的信用卡和贷款的借据信息、信贷查询记录信息、个人基本信息等,同时也是信贷风控的各个环节必不可少的因素。因此,如何通过个人征信报告快速生成目标特征簇(即信贷风控各个风险敞口方向的特征)成为亟待解决的问题。
目前,主要依靠专家经验人工构造目标特征簇,即基于银行系统的专家经验,对人行征信报告中的信贷特征进行加工,以形成目标特征簇。
但是,基于上述方法形成的目标特征簇存在特征维度小的问题。
发明内容
本申请的主要目的在于提供一种目标特征簇的生成方法、装置、终端及存储介质,以解决相关技术中形成的目标特征簇存在特征维度小的问题。
为了实现上述目的,第一方面,本申请提供了一种目标特征簇的生成方法,包括:
接收征信报告;
基于收征信报告,确定信贷风控的特征信息;
基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数;
基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇。
在一种可能的实现方式中,基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数,包括:
建立预设的范式化特征生成模型;
将信贷风控的特征信息输入到预设的范式化特征生成模型中,生成目标原子函数。
在一种可能的实现方式中,目标原子函数至少包括第一目标原子函数、第二目标原子函数和第三目标原子函数;
将信贷风控的特征信息输入到预设的范式化特征生成模型中,生成目标原子函数,包括:
将信贷风控的特征信息输入到预设的范式化特征生成模型中,生成第一目标原子函数、第二目标原子函数和第三目标原子函数,其中,第一目标原子函数用于存储信贷风控的特征信息对应的条件信息,第二目标原子函数用于存储信贷风控的特征信息对应的特征簇方向信息,第三目标原子函数用于存储信贷风控的特征信息对应的计算方式信息。
在一种可能的实现方式中,预设的范式化特征组合方式至少包括第一范式化特征组合方式和第二范式化特征组合方式,目标特征簇至少包括第一目标特征簇和第二目标特征簇;
基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇,包括:
基于第一范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第一目标特征簇;
基于第二范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第二目标特征簇。
在一种可能的实现方式中,条件信息至少包括第一条件信息,计算方式信息至少包括第一计算方式信息,第一目标特征簇包括多个子第一目标特征簇;
基于第一范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第一目标特征簇,包括:
选取第二目标原子函数中的任一特征簇方向信息作为第一特征簇方向信息;
分别在第一目标原子函数和第三目标原子函数中选取与第一特征簇方向信息相匹配的第一条件信息和第一计算方式信息;
将第一特征簇方向信息、第一条件信息和第一计算方式信息进行组合,得到多个子第一目标特征簇。
在一种可能的实现方式中,条件信息至少包括第二条件信息,计算方式信息至少包括第二计算方式信息,第二目标特征簇包括多个子第二目标特征簇;
基于第二范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第二目标特征簇,包括:
选取第二目标原子函数中的至少两个特征簇方向信息作为第二特征簇方向信息;
分别在第一目标原子函数和第三目标原子函数中选取与第二特征簇方向信息相匹配的第二条件信息和第二计算方式信息;
将第二特征簇方向信息、第二条件信息和第二计算方式信息进行组合,得到多个子第二目标特征簇。
在一种可能的实现方式中,基于征信报告,确定信贷风控的特征信息,包括:
读取征信报告中的数据;
对征信报告中的数据依次进行特征解析、特征清洗、编码映射和特征校验,得到信贷风控的特征信息。
第二方面,本发明实施例提供了一种目标特征簇的生成装置,包括:
接收模块,用于接收征信报告;
数据处理模块,用于基于征信报告,确定信贷风控的特征信息;
函数生成模块,用于基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数;
特征簇生成模块,用于基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇。
第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上任一种目标特征簇的生成方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上任一种目标特征簇的生成方法的步骤。
本发明实施例提供了一种目标特征簇的生成方法、装置、终端及存储介质,包括:接收征信报告,基于征信报告,确定信贷风控的特征信息,然后基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数,再基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇。本发明通过预设的范式化特征生成模型对信贷风控的特征信息进行分类,得到不同类型的目标原子函数,然后经预设的范式化特征组合方式将不同类型的目标原子函数进行组合,范式化产出大批量、高覆盖率的信贷特征,不仅提高了信贷特征的生成效率,还拓宽了目标特征簇的维度、覆盖面,此外,还为风控模型提供了特征依据,以提升风控模型的评估效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本发明一实施例提供的一种目标特征簇的生成方法的实现流程图;
图2是本发明另一实施例提供的一种目标特征簇的生成方法的实现流程图;
图3是本发明实施例提供的目标原子函数的结构示意图;
图4是本发明实施例提供的一种目标特征簇的生成装置的结构示意图;
图5是本发明实施例提供的终端的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
在一个实施例中,如图1所示,提供了一种目标特征簇的生成方法,包括以下步骤:
步骤S101:接收征信报告;
步骤S102:基于征信报告,确定信贷风控的特征信息。
在一实施例中,结合图2,当接收到征信报告后,需先读取征信报告中的数据,其中,征信报告中的数据可为XML或JSON等格式。以征信报告中的数据为XML格式为例,XML格式数据依次经特征解析、特征清洗、编码映射和特征校验(可为一、二代特征一致性校验),得到信贷风控的特征信息。其中,信贷风控的特征信息指用于信贷风控评估的特征信息,可为查询信息、信贷产品属性信息等。在本申请中,当获得到信贷风控的特征信息后,信贷风控的特征信息存储于数据中台,便于后续服务。
步骤S103:基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数;
步骤S104:基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇。
具体的,在建立科学的、规范的数据库时,需要满足一些规范,以优化数据存储方式,因此范式被广泛应用,范式指数据库存储数据时所遵循的规范。本申请中的预设的范式化特征生成模型根据具体实施例,设置了具体的数据存储的规范,以满足对信贷风控的特征信息的存储。其中,预设的范式化特征生成模型中的存储规范,可以基于不同的信息进行调整,此处不作具体限定。
在上述实施例的基础上,本申请中的信贷风控的特征信息经预设的范式化特征生成模型,生成不同类型的目标原子函数(即原子函数),其中,目标原子函数是基于预设的范式化特征生成模型中的存储规范,生成的与存储规范所对应的用于存储特定属性信息的特征集合。之后,不同类型的目标原子函数以预设的范式化特征组合方式(即范式化特征策略组合)进行组合,生成目标特征簇。其中,目标特征簇是指将多个特所征进行组合形成的特征集合,目标特征簇包括多个特征簇,如特征簇1、特征簇2、特征簇3…特征簇N,N为大于3的正整数。
本发明实施例提供了一种目标特征簇的生成方法,包括:接收征信报告,基于征信报告,确定信贷风控的特征信息,然后基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数,再基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇。本发明通过预设的范式化特征生成模型对信贷风控的特征信息进行分类,得到不同类型的目标原子函数,然后经预设的范式化特征组合方式将不同类型的目标原子函数进行组合,范式化产出大批量、高覆盖率的信贷特征,不仅提高了信贷特征的生成效率,还拓宽了目标特征簇的维度、覆盖面,此外,还为风控模型提供了特征依据,以提升风控模型的评估效果。
在一实施例中,步骤S103包括:
步骤S201:建立预设的范式化特征生成模型;
步骤S202:将信贷风控的特征信息输入到预设的范式化特征生成模型中,生成目标原子函数。
其中,目标原子函数至少包括第一目标原子函数、第二目标原子函数和第三目标原子函数,即本申请并不限于上述三类目标原子函数,目标原子函数还可以包括第四目标原子函数、第五目标原子函数等,具体以预设的范式化特征生成模型中所设置的存储规范而异。
进一步的,以目标原子函数包括第一目标原子函数、第二目标原子函数和第三目标原子函数,预设的范式化特征生成模型为C-T-F范式化特征生成框架为例,来说明目标原子函数生成的过程。具体的,C-T-F范式化特征生成框架中包括三类数据存储模块,分别为condition-特征生成条件模块、target-特征簇方向模块和function-特征计算方式模块。将信贷风控的特征信息输入到C-T-F范式化特征生成框架,分别生成与condition-特征生成条件模块对应的第一目标原子函数,与target-特征簇方向模块对应的第二目标原子函数,以及与function-特征计算方式模块对应的第三目标原子函数。其中,第一目标原子函数用于存储信贷风控的特征信息对应的条件信息,条件信息包括第一条件信息和第二条件信息;第二目标原子函数用于存储信贷风控的特征信息对应的特征簇方向信息;第三目标原子函数用于存储信贷风控的特征信息对应的计算方式信息,计算方式信息包括第一计算方式信息和第二条件信息。
下面以信贷风控的特征信息为信贷产品属性信息为例,说明目标原子函数生成的步骤,具体如下:
1、当接收到征信报告后,读取征信报告中的XML格式数据,并对XML格式数据依次进行特征解析、特征清洗、编码映射和特征校验,得到如表1所示的信贷产品属性信息。
表1信贷产品属性信息
其中,信贷产品属性信息以贷款产品类型进行分类,且每类贷款产品信息中的参数指标均相同,均包括贷款机构类型、贷款类型、期数、授信金额、以及表现期数。
2、将信贷产品属性信息输入到C-T-F范式化特征生成框架,生成第一目标原子函数、第二目标原子函数和第三目标原子函数。
具体的,结合图3,第一目标原子函数存储特征生成条件类数据,即特征生成依赖的前提条件,单个或多个组合,如贷款状态、贷款类型、贷款机构类型等;第二目标原子函数存储特征簇方向类数据,即特征计算的方向,比如:贷款的金额、余额、期数等;第三目标原子函数存储特征计算方式类数据,即枚举每个特征在不同表征维度的数值大小,如sum(和计算)、max(最大值计算)等。
在一实施例中,步骤S104包括:
步骤S301:基于第一范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第一目标特征簇;
步骤S302:基于第二范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第二目标特征簇。
其中,预设的范式化特征组合方式至少包括第一范式化特征组合方式和第二范式化特征组合方式,目标特征簇至少包括第一目标特征簇和第二目标特征簇,即预设的范式化特征组合方式和目标特征簇均可为多类,并不限于上述两类,可依据具体情况进行设定。
下面以预设的范式化特征组合方式包括第一范式化特征组合方式和第二范式化特征组合方式,目标特征簇包括第一目标特征簇和第二目标特征簇,以及第一目标特征簇包括多个子第一目标特征簇,第二目标特征簇包括多个子第二目标特征簇为例,来说明第一目标特征簇和第二目标特征簇的生成过程,具体如下:
在采用第一范式化特征组合方式的情况下,需先选取第二目标原子函数中的任一特征簇方向信息作为第一特征簇方向信息,然后分别在第一目标原子函数和第三目标原子函数中选取与第一特征簇方向信息相匹配的第一条件信息和第一计算方式信息,再将第一特征簇方向信息、第一条件信息和第一计算方式信息进行组合,得到多个子第一目标特征簇。
在一具体实施例中,以图3所示的信贷产品属性信息对应的第一原子函数、第二原子函数和第三原子函数为例,说明采用第一范式化特征组合方式生成多个子第一目标特征簇的步骤:
1、在第二目标原子函数中选取贷款金额作为特征簇方向信息;
2、选取与贷款金额相匹配的第一条件信息和第一计算方式信息,分别为贷款类型和计算最大值(sum),其中,贷款类型包括类型A、类型B和类型C;
3、将贷款金额、贷款类型和计算最大值(sum)进行组合(可为包括贷款金额的任意组合方式),可以得到多个子第一目标特征簇,如贷款金额、类型A和计算最大值(sum),贷款金额、类型B和计算最大值(sum),贷款金额、类型C和计算最大值(sum),贷款金额、类型B、类型C和计算最大值(sum)等。
在采用第二范式化特征组合方式的情况下,需先选取第二目标原子函数中的至少两个特征簇方向信息作为第二特征簇方向信息,然后分别在第一目标原子函数和第三目标原子函数中选取与第二特征簇方向信息相匹配的第二条件信息和第二计算方式信息,再将第二特征簇方向信息、第二条件信息和第二计算方式信息进行组合,得到多个子第二目标特征簇。
在一具体实施例中,以图3所示的信贷产品属性信息对应的第一原子函数、第二原子函数和第三原子函数为例,说明采用第二范式化特征组合方式生成多个子第二目标特征簇的步骤:
1、在第二目标原子函数中选取贷款金额和贷款期数作为特征簇方向信息;
2、选取与贷款金额、贷款期数相匹配的第二条件信息和第二计算方式信息,分别为贷款状态和计算最小值(min),其中,贷款状态包括贷款状态A和贷款状态B;
3、将贷款金额、贷款期数、贷款状态和计算最小值(min)进行组合(可为包括贷款金额、贷款期数的任意组合方式),可以得到多个子第二目标特征簇,如贷款金额、贷款期数、贷款状态B和计算最小值(min),贷款金额、贷款期数、贷款状态A、贷款状态B和计算最小值(min)等。
此处需要说明的是,在第一范式化特征组合方式和第二范式化特征组合方式的组合规则范围内,第一原子函数、第二原子函数和第三原子函数可进行任意组合,上述两个具体实施例仅为示例。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
图4示出了本发明实施例提供的一种目标特征簇的生成装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,一种目标特征簇的生成装置包括接收模块41、数据处理模块42、函数生成模块43和特征簇生成模块44,具体如下:
接收模块41,用于接收征信报告;
数据处理模块42,用于基于征信报告,确定信贷风控的特征信息;
函数生成模块43,用于基于信贷风控的特征信息和预设的范式化特征生成模型,确定信贷风控的特征信息对应的目标原子函数;
特征簇生成模块44,用于基于目标原子函数和预设的范式化特征组合方式,生成信贷风控的特征信息对应的目标特征簇。
在一种可能的实现方式中,函数生成模块43包括:
模型建立子模块,用于建立预设的范式化特征生成模型;
函数生成子模块,用于将信贷风控的特征信息输入到预设的范式化特征生成模型中,生成目标原子函数。
在一种可能的实现方式中,目标原子函数至少包括第一目标原子函数、第二目标原子函数和第三目标原子函数;
函数生成子模块包括:
函数生成单元,用于将信贷风控的特征信息输入到预设的范式化特征生成模型中,生成第一目标原子函数、第二目标原子函数和第三目标原子函数,其中,第一目标原子函数用于存储信贷风控的特征信息对应的条件信息,第二目标原子函数用于存储信贷风控的特征信息对应的特征簇方向信息,第三目标原子函数用于存储信贷风控的特征信息对应的计算方式信息。
在一种可能的实现方式中,预设的范式化特征组合方式至少包括第一范式化特征组合方式和第二范式化特征组合方式,目标特征簇至少包括第一目标特征簇和第二目标特征簇;
特征簇生成模块44包括:
第一特征簇生成子模块,用于基于第一范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第一目标特征簇;
第二特征簇生成子模块,用于基于第二范式化特征组合方式对第一目标原子函数、第二目标原子函数和第三目标原子函数进行组合,得到第二目标特征簇。
在一种可能的实现方式中,条件信息至少包括第一条件信息,计算方式信息至少包括第一计算方式信息,第一目标特征簇包括多个子第一目标特征簇;
第一特征簇生成子模块包括:
第一选取单元,用于选取第二目标原子函数中的任一特征簇方向信息作为第一特征簇方向信息;
第一匹配单元,用于分别在第一目标原子函数和第三目标原子函数中选取与第一特征簇方向信息相匹配的第一条件信息和第一计算方式信息;
第一组合单元,用于将第一特征簇方向信息、第一条件信息和第一计算方式信息进行组合,得到多个子第一目标特征簇。
在一种可能的实现方式中,条件信息至少包括第二条件信息,计算方式信息至少包括第二计算方式信息,第二目标特征簇包括多个子第二目标特征簇;
第二特征簇生成子模块包括:
第二选取单元,用于选取第二目标原子函数中的至少两个特征簇方向信息作为第二特征簇方向信息;
第二匹配单元,用于分别在第一目标原子函数和第三目标原子函数中选取与第二特征簇方向信息相匹配的第二条件信息和第二计算方式信息;
第二组合单元,用于将第二特征簇方向信息、第二条件信息和第二计算方式信息进行组合,得到多个子第二目标特征簇。
在一种可能的实现方式中,数据处理模块42包括:
数据读取子模块,用于读取征信报告中的数据;
数据处理子模块,用于对征信报告中的数据依次进行特征解析、特征清洗、编码映射和特征校验,得到信贷风控的特征信息。
图5是本发明实施例提供的终端的示意图。如图5所示,该实施例的终端5包括:处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。处理器50执行计算机程序52时实现上述各个目标特征簇的生成方法实施例中的步骤,例如图1所示的步骤101至步骤104。或者,处理器50执行计算机程序52时实现上述各个目标特征簇的生成装置实施例中各模块/单元的功能,例如图4所示模块/单元41至44的功能。
本发明还提供一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
在上述设备的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种目标特征簇的生成方法,其特征在于,包括:
接收征信报告;
基于所述征信报告,确定信贷风控的特征信息;
基于所述信贷风控的特征信息和预设的范式化特征生成模型,确定所述信贷风控的特征信息对应的目标原子函数;
基于所述目标原子函数和预设的范式化特征组合方式,生成所述信贷风控的特征信息对应的目标特征簇。
2.如权利要求1所述目标特征簇的生成方法,其特征在于,所述基于所述信贷风控的特征信息和预设的范式化特征生成模型,确定所述信贷风控的特征信息对应的目标原子函数,包括:
建立所述预设的范式化特征生成模型;
将所述信贷风控的特征信息输入到所述预设的范式化特征生成模型中,生成所述目标原子函数。
3.如权利要求2所述目标特征簇的生成方法,其特征在于,所述目标原子函数至少包括第一目标原子函数、第二目标原子函数和第三目标原子函数;
所述将所述信贷风控的特征信息输入到所述预设的范式化特征生成模型中,生成所述目标原子函数,包括:
将所述信贷风控的特征信息输入到所述预设的范式化特征生成模型中,生成所述第一目标原子函数、所述第二目标原子函数和所述第三目标原子函数,其中,所述第一目标原子函数用于存储所述信贷风控的特征信息对应的条件信息,所述第二目标原子函数用于存储所述信贷风控的特征信息对应的特征簇方向信息,所述第三目标原子函数用于存储所述信贷风控的特征信息对应的计算方式信息。
4.如权利要求3所述目标特征簇的生成方法,其特征在于,所述预设的范式化特征组合方式至少包括第一范式化特征组合方式和第二范式化特征组合方式,所述目标特征簇至少包括第一目标特征簇和第二目标特征簇;
所述基于所述目标原子函数和预设的范式化特征组合方式,生成所述信贷风控的特征信息对应的目标特征簇,包括:
基于所述第一范式化特征组合方式对所述第一目标原子函数、所述第二目标原子函数和所述第三目标原子函数进行组合,得到所述第一目标特征簇;
基于所述第二范式化特征组合方式对所述第一目标原子函数、所述第二目标原子函数和所述第三目标原子函数进行组合,得到所述第二目标特征簇。
5.如权利要求4所述目标特征簇的生成方法,其特征在于,所述条件信息至少包括第一条件信息,所述计算方式信息至少包括第一计算方式信息,第一目标特征簇包括多个子第一目标特征簇;
所述基于所述第一范式化特征组合方式对所述第一目标原子函数、所述第二目标原子函数和所述第三目标原子函数进行组合,得到所述第一目标特征簇,包括:
选取所述第二目标原子函数中的任一特征簇方向信息作为第一特征簇方向信息;
分别在所述第一目标原子函数和所述第三目标原子函数中选取与所述第一特征簇方向信息相匹配的第一条件信息和第一计算方式信息;
将所述第一特征簇方向信息、所述第一条件信息和所述第一计算方式信息进行组合,得到所述多个子第一目标特征簇。
6.如权利要求4所述目标特征簇的生成方法,其特征在于,所述条件信息至少包括第二条件信息,所述计算方式信息至少包括第二计算方式信息,所述第二目标特征簇包括多个子第二目标特征簇;
所述基于所述第二范式化特征组合方式对所述第一目标原子函数、所述第二目标原子函数和所述第三目标原子函数进行组合,得到所述第二目标特征簇,包括:
选取所述第二目标原子函数中的至少两个特征簇方向信息作为第二特征簇方向信息;
分别在所述第一目标原子函数和所述第三目标原子函数中选取与所述第二特征簇方向信息相匹配的第二条件信息和第二计算方式信息;
将所述第二特征簇方向信息、所述第二条件信息和所述第二计算方式信息进行组合,得到所述多个子第二目标特征簇。
7.如权利要求1-6中任一项所述目标特征簇的生成方法,其特征在于,所述基于所述征信报告,确定信贷风控的特征信息,包括:
读取所述征信报告中的数据;
对所述征信报告中的数据依次进行特征解析、特征清洗、编码映射和特征校验,得到所述信贷风控的特征信息。
8.一种目标特征簇的生成装置,其特征在于,包括:
接收模块,用于接收征信报告;
数据处理模块,用于基于所述征信报告,确定信贷风控的特征信息;
函数生成模块,用于基于所述信贷风控的特征信息和预设的范式化特征生成模型,确定所述信贷风控的特征信息对应的目标原子函数;
特征簇生成模块,用于基于所述目标原子函数和预设的范式化特征组合方式,生成所述信贷风控的特征信息对应的目标特征簇。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述目标特征簇的生成方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行所述计算机程序时实现如权利要求1至7中任一项所述目标特征簇的生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210174447.5A CN114549182A (zh) | 2022-02-24 | 2022-02-24 | 目标特征簇的生成方法、装置、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210174447.5A CN114549182A (zh) | 2022-02-24 | 2022-02-24 | 目标特征簇的生成方法、装置、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114549182A true CN114549182A (zh) | 2022-05-27 |
Family
ID=81678963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210174447.5A Pending CN114549182A (zh) | 2022-02-24 | 2022-02-24 | 目标特征簇的生成方法、装置、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114549182A (zh) |
-
2022
- 2022-02-24 CN CN202210174447.5A patent/CN114549182A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190035015A1 (en) | Method and apparatus for obtaining a stable credit score | |
WO2019061976A1 (zh) | 基金产品推荐方法、装置、终端设备及存储介质 | |
CN111371767B (zh) | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 | |
CN108573358A (zh) | 一种逾期预测模型生成方法及终端设备 | |
CN110827138A (zh) | 一种推送信息确定方法及装置 | |
CN111428217A (zh) | 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质 | |
US20230004979A1 (en) | Abnormal behavior detection method and apparatus, electronic device, and computer-readable storage medium | |
CN109858927A (zh) | 一种商户审核方法、装置、计算机可读存储介质及服务器 | |
CN110046868A (zh) | 一种处理审核信息的方法及设备 | |
CN113191565A (zh) | 安全性预测方法及装置、介质、设备 | |
CN114118570A (zh) | 业务数据预测方法及装置、电子设备和存储介质 | |
CN112150293A (zh) | 一种基于用户个人信息的产品推荐方法及装置 | |
CN114549182A (zh) | 目标特征簇的生成方法、装置、终端及存储介质 | |
CN110110295A (zh) | 大样本研报信息提取方法、装置、设备及存储介质 | |
CN115564578B (zh) | 欺诈识别模型生成方法 | |
CN113052692A (zh) | 数据处理的方法、装置、电子设备及计算机可读存储介质 | |
CN110782342B (zh) | 基于二分类模型验证新渠道特征工程正确性的方法及装置 | |
CN114240208A (zh) | 在险价值确定方法、装置、设备、介质及产品 | |
CN117391330A (zh) | 金融业务办理顺序确定方法、装置和计算机设备 | |
CN112150292A (zh) | 基金定投账户的监测方法、装置、系统及存储介质 | |
CN115455944A (zh) | 文本处理方法、装置及电子设备 | |
CN117273219A (zh) | 一种营业网点数量的优化方法、装置、设备及存储介质 | |
CN116703579A (zh) | 一种客户的交易预测方法、装置、服务器 | |
CN113220749A (zh) | 业务数据的处理方法、装置和电子设备 | |
CN116664130A (zh) | 基于异常交易行为的告警方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |