CN113536672A - 目标对象处理方法及装置 - Google Patents
目标对象处理方法及装置 Download PDFInfo
- Publication number
- CN113536672A CN113536672A CN202110780307.8A CN202110780307A CN113536672A CN 113536672 A CN113536672 A CN 113536672A CN 202110780307 A CN202110780307 A CN 202110780307A CN 113536672 A CN113536672 A CN 113536672A
- Authority
- CN
- China
- Prior art keywords
- user
- target
- sample
- training
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 claims abstract description 123
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims description 248
- 238000011156 evaluation Methods 0.000 claims description 204
- 238000004422 calculation algorithm Methods 0.000 claims description 38
- 238000012360 testing method Methods 0.000 claims description 35
- 238000013441 quality evaluation Methods 0.000 claims description 25
- 238000003860 storage Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 description 29
- 238000009395 breeding Methods 0.000 description 12
- 230000001488 breeding effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000009360 aquaculture Methods 0.000 description 4
- 244000144974 aquaculture Species 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000013097 stability assessment Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000001303 quality assessment method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书提供目标对象处理方法及装置,所述方法包括:基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息;基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征;基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。该方法基于从对象处理平台的用户信息表、用户特征表中获取至少一个目标用户和每个目标用户的信用信息、用户特征,对目标对象进行处理,减少跨平台成本,节省计算机处理资源。
Description
技术领域
本说明书涉及计算机技术领域,特别涉及一种目标对象处理方法。本说明书同时涉及一种目标对象处理装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着互联网和金融行业的快速发展,涌现了大量的互联网金融企业,用户可以向互联网金融企业发起借款,而互联网金融企业则会基于风控模型对用户在借款过程中出现违约、欺诈等安全风险进行预测,并根据预测结果对用户进行放款,从而避免安全风险对互联网金融企业造成的损害。
但现有技术中,风控模型的训练流程较为复杂,构建模型的训练数据以及对模型进行训练,是分别在不同的平台进行处理的,使得计算机的处理资源被大量占用,增加了模型训练的成本,降低了模型训练的效率。
发明内容
有鉴于此,本说明书实施例提供了一种目标对象处理方法。本说明书同时涉及一种目标对象处理装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种目标对象处理方法,应用于对象处理平台,包括:
基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息;
基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征;
基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。
根据本说明书实施例的第二方面,提供了一种目标对象处理装置,包括:
第一获取模块,被配置为基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息;
第二获取模块,被配置为基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征;
处理模块,被配置为基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现任意所述目标对象处理方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现任意所述目标对象处理方法的步骤。
本说明书提供的目标对象处理方法,基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息;并且基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征;之后基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。具体地,所述方法通过从对象处理平台获取至少一个目标用户、每个目标用户的信用信息以及每个目标用户的用户特征,并根据每个目标用户的用户特征以及每个目标用户的信用信息,在对象处理平台上对目标对象进行处理,从而实现通过一个对象处理平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本,节省了计算机处理资源,提高了模型训练的效率。
附图说明
图1是本说明书一实施例提供的一种通过ODPS平台以及PAI平台的交互操作实现对PD模型进行构建的处理流程图;
图2是本说明书一实施例提供的一种目标对象处理方法的流程图;
图3是本说明书一实施例提供的一种应用于通过PAI平台实现对PD模型进行构建的场景下的目标对象处理方法的处理流程图;
图4是本说明书一实施例提供的一种目标对象处理装置的结构示意图;
图5是本说明书一实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
机器学习:机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
特征:机器学习模型的输入变量。
PD模型:违约概率(Probability ofDefault)模型,简称为PD模型,是指信贷领域需要预测出用户违约概率的预测模型。
PAI:人工智能平台,简称为PAI平台,一种机器学习平台,支持以组件拖拽的方式构建建模流程。
一站式:指的是所有操作在一个页面完成,无需跳转。
ODPS平台:开放数据处理服务(Open Data Processing Service)平台,简称为ODPS平台,是一种提供大数据计算服务的平台。
pipeline:为流水线,是指将模型构建的各个流程串联在一起,可以一键依次执行并产出最终结果。
IV:信息价值(Information Value)或者信息量,简称为IV值,是用来表示特征对目标预测的贡献程度,即特征的预测能力,一般来说,IV值越高,该特征的预测能力越强,信息贡献程度越高。
PSI值:群体稳定性指标(population stability index)值,简称为PSI值,是一种衡量特征稳定性评估指标。
AUC值:曲线下方的面积(area under the curve)值,简称为AUC值,具体是指ROC(receiver operating characteristic)曲线下方的面积,AUC值是一种能够客观反映模型的预测能力的评价指标。
KS值:柯尔莫可洛夫-斯米洛夫(Kolmogorov-Smirnov)值,简称为KS值,KS值能够用于模型风险区分能力进行评估。
在互联网金融企业的PD模型训练的过程中,往往是多个平台一起使用,通过多个平台共同完成PD模型的训练,一方面导致了模型构建流程存在割裂的问题;模型训练数据的清洗和分析通常在ODPS平台上进行处理,有时还需要将处理结果黏贴到本地,进行画图查看;而模型构建过程中的模型训练,模型预测等环节又需要在PAI平台上进行;由于模型构建的每个流程的操作分别在不同的平台进行,从而导致只能一步一步的执行模型构建任务,难以串联成pipeline,自动化程度低。
另一方法导致了模型构建的周期较长,由于模型构建流程非标准化,需要投入大量的时间进行代码开发工作,而且在多个平台对模型进行构建,导致了整体模型构建时间较长。
参见图1,图1是本说明书一实施例提供的一种通过ODPS平台以及PAI平台的交互操作实现对PD模型进行构建的处理流程图,具体包括以下步骤:
步骤102:ODPS-样本定义。
具体的,在PD模型构建的样本定义环节,用户需要在ODPS平台上对数据进行清洗和分析,从而获得PD模型的训练样本。
步骤104:ODPS-特征拼接。
具体的,在PD模型构建的特征拼接环节,用户基于训练样本,在ODPS平台上对特征进行拼接,从而获得用于对PD模型进行训练的特征。
步骤106:ODPS-特征评估。
具体的,在PD模型构建的特征评估环节,用户能够根据PD模型的要求,在ODPS平台上对拼接后特征进行评估,筛选出有效的特征,并将无效的特征进行删除。
步骤108:PAI-模型训练。
具体的,在PD模型构建的模型训练环节,ODPS需要将该训练样本以及有效的特征发送至PAI平台,在PAI平台上将有效的特征作为训练样本,将训练样本作为标签;根据训练样本和标签生成训练数据集,并将训练数据集划分为训练数据子集以及测试数据子集。
在PAI平台上通过训练数据子集对PD模型进行训练,获得训练后的PD模型;根据测试数据子集对训练后的PD模型进行测试,获得PD模型输出的表征样本用户的是否逾期的预测结果;通过样本用户对应的标签判断PD模型的预测结果是否正确。
在PD模型输出的预测结果为正确的情况下,确定PD模型通过测试,从而完成对PD模型的训练。
步骤110:ODPS-模型评估。
具体地,在PD模型构建的模型评估环节,当PAI平台完成对PD模型的训练之后,需要将训练完成的PD模型发送至ODPS平台,并在ODPS平台上完成对PD模型的性能以及稳定性的评估,从而实现PD模型的构建。
基于上述描述可知,上述通过ODPS平台以及PAI平台的交互操作实现对PD模型进行构建的方法,存在构建流程割裂、需要跨平台操作的问题,导致构建PD模型的效率较低,并且浪费了大量的计算机处理资源。
基于此,在本说明书中,提供了一种目标对象处理方法,本说明书同时涉及一种目标对象处理装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图2示出了根据本说明书一实施例提供的一种目标对象处理方法的流程图,具体包括以下步骤:
步骤202:基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息。
其中,目标对象可以理解为需要对象处理平台进行处理的对象,目标对象处理方法的应用场景不同,相应地,目标对象也不同;例如目标对象处理方法应用在模型训练场景中,目标对象可以是预测模型、识别模型;为了便于理解,本说明书中仅以目标对象为预测模型为例,对目标对象处理方法进行详细介绍。
目标属性信息可以理解为对象处理平台接收到、建模人员预先配置的目标用户的属性信息,基于该属性信息能够从用户信息表获取至少一个与该属性信息对应的目标用户以及每个目标用户的信用信息的属性信息。
在目标对象为预测模型的情况下,对象处理平台可以理解为能够对预测模型进行训练的模型训练平台。
用户信息表可以理解为部署在对象处理平台上的、用于存储用户信息的二维表。在对象处理平台为模型训练平台的情况下,用户信息表可以理解为样本用户信息表;相应地,目标用户可以理解为用于对模型进行训练的目标样本用户。在本说明书实施例中,用户信息表中存储多个用户以及每个用户的属性信息和信用信息。
在目标对象为预测模型的情况下,用户的信用信息可以理解为表征用户是否违约、是否在约定期限内还款等信用问题的信息。
目标用户的属性信息可以理解为目标用户的类型,比如目标用户的类型可以为养殖类、种植类。
具体地,对象处理平台基于接收到的目标属性信息从部署在对象处理平台上的用户信息表中,获取至少一个与目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,该用户信息表中存储多个用户以及每个用户的属性信息和信用信息。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对从对象处理平台的用户信息表中获取至少一个目标用户以及每个目标用户的信用信息进行详细说明,其中,目标对象可以为预测模型,对象处理平台可以为模型训练平台,用户信息表可以为样本用户信息表,例如,该样本用户信息表中包含了“养殖类”用户、“种植类”用户以及“水产业”用户。
模型训练平台在接收到建模人员发送的样本用户的类型为“养殖类”的情况下,从预先部署在模型训练平台上的样本用户信息表中获取到“养殖类”用户以及“养殖类”用户对应的信用信息。
在实际应用中,建模人员预先将样本用户以及样本用户对应的属性信息和信用信息进行数据标准化处理,将样本用户对应的属性信息以及信用信息等数据的格式进行规整,形成一个通用的样本用户信息表,并通过组件化的方式将样本用户信息表预先部署在模型训练平台上,从而使得后续的建模人员只需要向样本用户信息表对应的组件输入目标用户的属性信息,即可获得该属性信息对应的至少一个目标样本用户以及每个目标样本用户的属性信息和信用信息。
步骤204:基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征。
其中,用户特征表可以理解为部署在对象处理平台上的用于存储目标用户对应的用户特征的二维表。
用户特征可以理解为用于构成用户自身并且表征用户与其他用户的区别的特征,具体可以为用户的个人信息、账户数据以及交易行为等各方面的数据。
具体地,对象处理平台在获取至少一个目标用户以及每个目标用户的信用信息后,基于该至少一个目标用户的属性信息从预先部署在对象处理平台上的用户特征表中,获取每个目标用户的用户特征。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对从对象处理平台的用户特征表中获取每个目标用户的用户特征进行详细说明,其中,目标用户的用户特征可以为目标样本用户的用户特征,至少一个目标用户的属性信息可以为用户的类型为“养殖类”。
模型训练平台从样本用户信息表中获取样本用户以及样本用户的信用信息之后,基于目标样本用户为“养殖类”这一用户类型,从样本用户特征表中获取与“养殖类”对应的目标样本用户的用户特征,并建立该用户特征与每个样本用户的信用信息之间的关联关系。
在实际应用中,建模人员预先将样本用户的特征信息进行数据标准化处理,形成一个通用的样本用户特征表,并通过组件化的方式将样本用户特征表预先部署在模型训练平台上,从而使得后续的建模人员只需要基于样本用户特征表,即可自动建立该用户特征与每个样本用户的信用信息之间的关联关系,实现自动拼接特征,无需人工指定特征字段。
在本说明书一实施例中,所述获取每个目标用户的用户特征之后,还包括:
接收携带有特征评估阈值的特征评估请求;
基于所述特征评估请求对所述每个目标用户的用户特征进行评估,获得所述用户特征的评估值;
在所述用户特征的评估值满足所述特征评估阈值的情况下,确定所述用户特征为目标用户特征。
其中,特征评估请求可以理解为指示对象处理平台对获取到的每个目标用户的用户特征进行评估的请求,在对象处理平台为模型训练平台的情况下,模型训练平台为对样本用户的用户特征进行评估的请求。
评估值可以理解为通过计算公式计算出的表征用户特征某一性能的数值,该计算公式可以为现有技术当中任意一种可以计算出用户特征的评估值的公式,本说明书实施例对此不作任何限定。
在对象处理平台为模型训练平台的情况下,特征评估阈值可以理解为一个数值,该数值用于判断用户特征是否满足模型训练要求的判断条件,特征评估阈值为0.5,在用户特征的评估值大于等于特征评估阈值0.5的情况下,将该用户特征确定为目标用户特征,在用户特征的评估值小于特征评估阈值0.5的情况下,将该用户特征进行删除。
具体的,对象处理平台在获取每个目标用户的用户特征之后,能够接收携带有特征评估阈值的特征评估请求;并基于特征评估请求对每个目标用户的用户特征进行评估,获得用户特征的评估值;在用户特征的评估值满足特征评估阈值的情况下,确定用户特征为目标用户特征。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对基于特征评估阈值对特征评估进行评估做进一步详细说明,其中,特征评估阈值可以为0.5。
模型训练平台从样本用户特征表中获取的每个目标样本用户的用户特征可能是1000个,但是1000个用户特征中会存在具有稳定性差、质量不满足训练要求等问题的问题用户特征。其中,稳定性差的特征可以是该用户特征的取值随着时间的变化出现较大的波动,例如,用户特征可以为养殖类用户的账户金额,该账户金额可以为200万,若账户金额随着时间的变化,按照总账户金额的60%的比例进行增加或者减少,则可以确定账户金额这一用户特征的稳定性较高,若养殖类用户的账户金额随着时间的变化,按照超过总账户金额的60%的比例进行增加或者减少,则表示账户金额这一用户特征的稳定性较低。
用户特征的质量不满足训练要求可以是该用户特征的存在错误的比率高于2%、或者该用户特征中的数据丢失率高于3%的问题。
而模型训练平台在对模型进行训练过程中,并不能使用问题用户特征对模型进行训练。
基于此,模型训练平台能够接收到建模人员发送的携带有特征评估阈值的特征评估请求,并基于特征评估请求,将每个目标用户的用户特征作为参数,通过现有技术中任意一种可以计算出用户特征的评估值的公式,计算出每个目标用户的用户特征的评估值,并且在用户特征的评估值大于等于特征评估阈值的情况下,确定该用户特征为目标用户特征,后续将该用户特征用于对模型进行训练。
本说明书实施例中,通过对每个目标用户的用户特征进行评估,获得用户特征的评估值;并且在用户特征的评估值满足所述特征评估阈值的情况下,精准的将该用户特征确定为目标用户特征,实现了后续能够通过质量较好、稳定性较高的用户特征对目标对象进行处理,提高模型训练的效率,保证了训练后的模型的质量。
在本说明书实施例中,所述基于所述特征评估请求对所述每个目标用户的用户特征进行评估,获得所述用户特征的评估值,包括:
基于所述特征评估请求将所述每个目标用户的用户特征通过第一质量算法进行评估,获得所述用户特征的质量评估值;
基于所述特征评估请求将所述每个目标用户的用户特征通过第一有效性算法进行评估,获得所述用户特征的有效性评估值;
基于所述特征评估请求将所述每个目标用户的用户特征通过第一稳定性算法进行评估,获得所述用户特征的稳定性评估值。
其中,第一质量算法可以理解为对每个目标用户的用户特征的质量进行评估的算法;相应的,质量评估值可以理解为表征用户特征的质量的数值,该质量评估值是通过第一质量算法对进行用户特征进行计算获得的。
第一有效性算法可以理解为对每个目标用户的用户特征的有效性进行评估的算法,在目标对象为预测模型的情况下,用户特征的有效性可以为表示用户特征对预测模型输出的预测结果的贡献程度,即样本特征的预测能力。相应的,有效性评估值可以理解为表征用户特征的有效性的数值,该有效性评估值是通过第一有效性算法对进行用户特征进行计算获得的,具体可以为用户特征的IV(Information Value)值;在实际应用中,IV值越高,该用户特征的预测能力越强,信息贡献程度也就越高。
第一稳定性算法可以理解为对每个目标用户的用户特征的稳定性进行评估的算法,在目标对象为预测模型的情况下,用户特征的稳定性可以理解为该用户特征的取值随着时间的推移会不会发生较大的波动,例如,用户特征可以为养殖类用户的账户金额,该账户金额可以为200万,若账户金额随着时间的变化,按照总账户金额的60%的比例进行增加或者减少,则可以确定账户金额这一用户特征的稳定性较高,若养殖类用户的账户金额随着时间的变化,按照超过总账户金额的60%的比例进行增加或者减少,则表示账户金额这一用户特征的稳定性较低。相应的,稳定性评估值可以理解为表征用户特征的稳定性的数值,该稳定性评估值是通过第一稳定性算法对进行用户特征进行计算获得的,具体可以为用户特征的PSI(population stability index)值。
具体的,对象处理平台能够基于特征评估请求将每个目标用户的用户特征通过第一质量算法进行评估,获得用户特征的质量评估值;基于特征评估请求将每个目标用户的用户特征通过第一有效性算法进行评估,获得用户特征的有效性评估值;基于特征评估请求将每个目标用户的用户特征通过第一稳定性算法进行评估,获得用户特征的稳定性评估值。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对通过第一质量算法、第一有效性算法以及第一稳定性算法对用户特征进行评估做进一步详细说明。
模型训练平台在接收到特征评估请求之后,能够每个目标用户的用户特征作为参数通过第一质量算法、第一有效性算法以及第一稳定性算法对每个目标样本用户的用户特征进行评估,分别通过第一质量算法计算出表示用户特征质量的质量评估值、通过第一有效性算法计算出表示用户特征有效性的IV值以及通过第一稳定性算法计算出表示用户特征稳定性的PSI值,从而基于用户特征的质量评估值、IV值以及PSI值实现对每个目标样本用户的用户特征进行评估。
本说明书实施例中,对象处理平台通过第一质量算法、第一有效性算法以及第一稳定性算法实现进一步对每个目标用户的用户特征进行评估,从而实现了后续能够通过质量较好、稳定性较高的用户特征对目标对象进行处理,保证了训练后的模型的质量。
在说明书实施例中,所述在所述用户特征的评估值满足所述特征评估阈值的情况下,确定所述用户特征为目标用户特征,包括:
在所述用户特征的质量评估值满足质量评估阈值、所述用户特征的有效性评估值满足有效性评估阈值和所述用户特征的稳定性评估值满足稳定性评估阈值的情况下,确定所述用户特征为目标用户特征。
其中,质量评估阈值可以理解为用于判断用户特征的质量是否满足模型训练要求的阈值,在用户特征的质量评估值满大于等于质量评估阈值的情况下,表示该用户特征的质量满足模型训练的要求,比如质量评估阈值可以为80,在用户特征的质量评估值大于等于80的情况下,表示该用户特征的质量满足模型训练的要求。
有效性评估阈值可以理解为用于判断用户特征的有效性是否满足模型训练要求的阈值,在用户特征的有效性评估值大于等于有效性评估阈值的情况下,表示该用户特征的有效性满足模型训练的要求,比如有效性评估阈值可以为1,在用户特征的有效性评估值大于等于1的情况下,表示该用户特征的有效性满足模型训练的要求。
稳定性评估阈值可以理解为用于判断用户特征的稳定性是否满足模型训练要求的阈值,在用户特征的稳定性评估值小于等于稳定性评估阈值的情况下,表示该用户特征的稳定性满足模型训练要求,比如稳定性评估阈值可以为0.2,在用户特征的稳定性评估值小于等于0.2的情况下,表示该用户特征的稳定性满足模型训练的要求。。
具体的,对象处理平台在用户特征的质量评估值满足质量评估阈值、用户特征的有效性评估值满足有效性评估阈值和用户特征的稳定性评估值满足稳定性评估阈值的情况下,确定用户特征为目标用户特征。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对确定用户特征为目标用户特征进行详细说明,其中,质量评估阈值可以为80、有效性评估阈值可以为1,稳定性评估阈值可以为0.2。
模型训练平台在通过第一质量算法、第一有效性算法以及第一稳定性算法对每个目标样本用户的用户特征进行评估,计算出用户特征的质量评估值、IV值以及PSI值之后,判断用户特征的质量评估值、IV值以及PSI值是否满足对应的评估阈值,在该表示用户特征质量的质量评估值大于等于80、表示用户特征有效性的IV值大于等于1以及表示用户特征稳定性的PSI值小于等于0.2的情况下,将该用户特征确定为目标用户特征,后续将该目标用户特征用于对模型进行训练。
本说明书实施例中,通过在用户特征的质量评估值满足质量评估阈值、用户特征的有效性评估值满足有效性评估阈值和用户特征的稳定性评估值满足稳定性评估阈值的情况下,确定用户特征为目标用户特征,从而实现了后续能够通过质量较好、稳定性较高的用户特征对目标对象进行处理,保证了训练后的模型的质量。
步骤206:基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。
其中,在目标对象为预测模型的情况下,对目标对象进行处理可以理解为对该预测模型进行训练。
具体地,对象处理平台基于每个目标用户的用户特征以及每个目标用户的信用信息,对目标对象进行处理。
沿用上例,以目标对象处理方法应用于对预测模型进行训练的场景为例,对基于用户特征以及信用信息对目标对象进行处理做进一步详细说明。
模型训练平台将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,基于训练样本和样本标签生成训练数据集,并将训练数据集划分为训练数据子集以及测试数据子集。
模型训练平台通过该训练数据子集对预测模型进行训练,获得训练后的预测模型,并通过该测试数据子集对训练后的预测模型进行测试,获得训练后的预测模型的预测值。
判断该预测值与预设预测值进行比对,若比对结果为一致,则表示预测模型能够根据用户的特征预测出用户是否会逾期,从而达到训练停止条件,获得完成模型训练的预测模型。
若比对结果为不一致,则表示未到达训练停止条件,将预测模型的模型参数进行调整,继续对预测模型进行训练,直至预测模型的预测值与预设预测值的匹配结果为一致,从而达到训练停止条件。
在本说明书一实施例中,所述对所述目标对象进行处理之后,还包括:
基于接收到的对象评估请求从所述对象处理平台中获取评估数据;
根据所述评估数据对处理后的目标对象进行评估。
其中,对象评估请求可以理解为建模人员发送的针对处理后的目标对象进行评估的请求,在目标对象为预测模型的情况下,该对象评估请求可以为针对训练后的预测模型进行评估的请求。
评估数据可以理解为用于对目标对象进行评估的目标用户的信用信息以及目标用户的用户特征,在实际应用中,对象处理平台能够根据对象评估请求,从部署在对象处理平台上的用户信息表获取用于对目标对象进行评估的目标用户的信用信息,以及从用户特征表中获取用于对目标对象进行评估的目标用户的用户特征,将该信用信息以及该用户特征作为评估数据。
具体的,对象处理平台在接收到的对象评估请求之后,基于接收到的对象评估请求从所述对象处理平台中获取评估数据;并根据所述评估数据对处理后的目标对象进行评估。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对基于用户特征以及信用信息对目标对象进行处理做进一步详细说明,其中,目标对象为预测模型,对象处理平台为模型训练平台,对象评估请求为模型评估请求,评估数据为对象处理平台中的样本用户信息表以及样本用户特征表中存储的用户的信用信息以及用户特征。
模型训练平台在接受到建模人员发送的针对训练后的预测模型进行评估的模型评估请求,根据该模型评估请求从模型训练平台的样本用户信息表中,获取用于对预测模型进行评估的样本用户的信用信息;根据该模型评估请求从模型训练平台的样本用户特征表中,获取用于对预测模型进行评估的样本用户的用户特征。基于该信用信息以及该用户特征生成评估数据集,并通过该评估数据集对预测模型的性能以及稳定性进行评估。
在本说明书实施例中,模型训练平台能够将训练后的预测模型的预测效果与基线预测模型的预测效果进行对比,通过对比结果对训练后的预测模型进行评估,其中,基线预测模型可以为训练完成的且性能较好的模型,该基线预测模型用于对训练后的预测模型的性能进行检测,具体地,通过将训练后的预测模型的预测效果与基线预测模型的预测效果进行比较,从而判断出训练后的预测模型的性能是否优于基线预测模型。
本说明书实施例中,对象处理平台基于接收到的对象评估请求从对象处理平台中快速地获取到评估数据;并根据该评估数据对处理后的目标对象进行评估。从而准确的评估出处理后的目标对象的性能,从而保证了目标对象的质量,避免了目标对象性能以及稳定性存在不足的问题。
在本说明书一实施例中,所述根据所述评估数据对处理后的目标对象进行评估,包括:
基于所述评估数据与处理后的目标对象,获得针对所述处理后的目标对象的性能评估值;
基于所述评估数据对应的真实评估值和性能评估值对所述处理后的目标对象进行评估。
其中,性能评估值可以理解为表征目标对象性能的数值,在本说明书实施例中,该性能评估值是通过性能评估算法计算获得的,在目标对象为预测模型的请求下,该性能评估值具体可以为AUC值、KS值等。
真实评估值可以理解为预先设定的用于判断目标对象的评估结果是否符合预期的数值,在本说明书实施例中,通过判断性能评估值是否大于等于评估数据对应的真实评估值,从而对处理后的目标对象进行评估。
具体地,对象处理平台在获得评估数据之后,基于该评估数据与处理后的目标对象,获得针对处理后的目标对象的性能评估值;基于评估数据对应的真实评估值和性能评估值对处理后的目标对象进行评估。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对通过真实评估值和性能评估值对处理后的目标对象进行评估做进一步详细说明,其中,目标对象为预测模型,性能评估值为KS值。
模型训练平台在获取到评估数据之后,将该评估数据中的用户特征输入至训练后的预测模型中,获得预测模型的预测结果;并将预测模型的预测结果作为KS值计算参数,通过KS值计算公式计算获得预测模型的KS值。
通过将预测模型的KS值与评估数据对应的真实评估值进行比对的方式,对训练后的预测模型进行评估,如果预测模型的KS值大于等于评估数据对应的真实评估值,则表示预测模型的性能较好;如果预测模型的KS值小于评估数据对应的真实评估值,则表示预测模型的性能较差。
本说明书实施例中,对象处理平台基于评估数据与处理后的目标对象,获得针对处理后的目标对象的性能评估值;并基于评估数据对应的真实评估值和性能评估值对处理后的目标对象进行评估。从而准确的评估出处理后的目标对象的性能,从而保证了目标对象的质量,避免了目标对象性能以及稳定性存在不足的问题。
在本说明书一实施例中,所述基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,包括:
基于接收的目标属性信息从模型训练平台的样本用户信息表中,获取至少一个与所述目标属性信息对应的目标样本用户以及每个目标样本用户的信用信息,其中,所述样本用户信息表中存储多个样本用户以及每个样本用户的属性信息和信用信息。
其中,样本用户信息表可以理解为部署在模型训练平台上的用于存储样本用户信息的二维表。
具体的,模型训练平台基于接收的目标属性信息从模型训练平台上部署的样本用户信息表中,获取至少一个与目标属性信息对应的目标样本用户以及每个目标样本用户的信用信息,其中,样本用户信息表中存储多个样本用户以及每个样本用户的属性信息和信用信息。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对从模型训练平台的样本用户信息表中获取至少一个目标样本用户以及每个目标样本用户的信用信息进行详细说明,其中,样本用户信息表中包含了“养殖类”用户、“种植类”用户以及“水产业”用户,目标属性信息可以为样本用户的类型,具体可以为“养殖类”。
模型训练平台在接收到建模人员发送的样本用户的类型为“养殖类”的情况下,根据“养殖类”这一用户的类型;并从预先部署在模型训练平台上的样本用户信息表中获取与“养殖类”对应的样本用户以及样本用户的信用信息。
在实际应用中,样本用户信息表,建模人员预先将样本用户以及样本用户对应的属性信息和信用信息进行数据标准化处理,将样本用户对应的属性信息以及信用信息等数据的格式进行规整,形成一个通用的样本用户信息表,并通过组件化的方式将样本用户信息表预先部署在模型训练平台上。
在本说明书实施例中,模型训练平台基于接收的目标属性信息从模型训练平台的样本用户信息表中,获取至少一个目标样本用户以及每个目标样本用户的信用信息,从而实现通过一个平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本,节省了计算机处理资源。
在本说明书一实施例中,所述基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征,包括:
基于所述至少一个目标样本用户的属性信息从所述模型训练平台的样本用户特征表中,获取每个目标样本用户的用户特征。
其中,样本用户特征表可以理解为部署在模型训练平台上的用于存储目标样本用户对应的用户特征的二维表。
具体的,模型训练平台基于至少一个目标样本用户的属性信息从模型训练平台上部署的样本用户特征表中,获取每个目标样本用户的用户特征。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对从样本用户特征表中获取每个目标样本用户的用户特征进行详细说明。
模型训练平台从样本用户信息表中获取样本用户以及样本用户的信用信息之后,基于目标样本用户为“养殖类”这一属性信息,从样本用户特征表中获取与“养殖类”对应的目标样本用户的用户特征,并建立该用户特征与每个样本用户的信用信息之间的关联关系。
在实际应用中,建模人员预先将样本用户的特征信息进行数据标准化处理,形成一个通用的样本用户特征表,并通过组件化的方式将样本用户特征表预先部署在模型训练平台上,从而使得后续的建模人员只需要基于样本用户特征表,即可建立该用户特征与每个样本用户的信用信息之间的关联关系,实现自动拼接特征,无需人工指定特征字段。
在本说明书实施例中,模型训练平台基于至少一个目标样本用户的属性信息从模型训练平台的样本用户特征表中,获取每个目标样本用户的用户特征,从而实现通过一个平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本,节省了计算机处理资源。
在本说明书一实施例中,所述基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理,包括:
基于每个目标样本用户的用户特征以及每个目标样本用户的信用信息,对预测模型进行训练。
具体的,模型训练平台基于每个目标样本用户的用户特征以及每个目标样本用户的信用信息,对预测模型进行训练。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对基于样本用户特征以及信用信息对预测模型进行训练做进一步详细说明。
模型训练平台将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,基于训练样本和样本标签生成训练数据集,并将训练数据集划分为训练数据子集以及测试数据子集。
模型训练平台通过该训练数据子集对预测模型进行训练,获得训练后的预测模型,并通过该测试数据子集对训练后的预测模型进行测试,获得训练后的预测模型的预测值。
判断该预测值与预设预测值进行比对,若比对结果为一致,则表示预测模型能够根据用户的特征预测出用户是否会逾期,从而达到训练停止条件,获得完成模型训练的预测模型。
若比对结果为不一致,则表示未到达训练停止条件,将预测模型的模型参数进行调整,继续对预测模型进行训练,直至预测模型的预测值与预设预测值的匹配结果为一致,从而达到训练停止条件。
在本说明书实施例中,模型训练平台基于每个目标样本用户的用户特征以及每个目标样本用户的信用信息,对预测模型进行训练,实现通过一个平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本,进一步节省了计算机处理资源,提高了模型训练的效率。
在本说明书一实施例中,所述基于每个目标样本用户的用户特征以及每个目标样本用户的信用信息,对所述预测模型进行训练,包括:
将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,基于所述训练样本和所述样本标签对所述预测模型进行训练。
具体的,模型训练平台将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,并基于训练样本和样本标签对预测模型进行训练。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对通过训练样本和样本标签对所述预测模型进行训练做进一步详细说明,训练样本为用户的个人信息、交易信息等特征,样本标签为样本用户是否逾期。
模型训练平台将每个目标样本用户的个人信息、交易信息等用户特征作为训练样本,将每个目标样本用户是否逾期的信息作为样本标签,并基于训练样本和样本标签对预测模型进行训练。
本说明书实施例中,模型训练平台将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,并基于训练样本和样本标签对预测模型进行训练。实现通过一个平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本,进一步节省了计算机处理资源。
在本说明书一实施例中,所述基于所述训练样本和所述样本标签对所述预测模型进行训练,包括:
基于所述训练样本和所述样本标签生成训练数据集,并将所述训练数据集划分为训练数据子集以及测试数据子集;
根据所述训练数据子集对所述预测模型进行训练,获得训练后的预测模型;
根据所述测试数据子集对所述训练后的预测模型进行测试,获得所述训练后的预测模型的预测值;
根据所述预测值对所述训练后的预测模型进行迭代更新,直至达到训练停止条件。
其中,训练数据集可以理解为对于预测模型的训练数据的集合。
训练数据子集可以理解为用于对预测模型进行训练的训练样本和样本标签的集合。
测试数据子集可以理解为用于对预测模型进行测试的训练样本和样本标签的集合。
预测值可以理解为通过测试数据子集对预测模型进行测试的过程中,预测模型输出的预测结果。在本说明书实施例中,预测模型根据样本用户的用户特征,对样本用户是否会出现逾期的问题进行预测。比如,可以通过数值的形式对样本用户是否会出现逾期的问题的概率进行表示,也即使对用户出现逾期的问题的概率进行打分,预测模型输出的分数越高,用户的会出现逾期的问题的概率越低。
具体地,模型训练平台基于训练样本和样本标签生成训练数据集,并将训练数据集划分为训练数据子集以及测试数据子集;根据训练数据子集对预测模型进行训练,获得训练后的预测模型;根据测试数据子集对训练后的预测模型进行测试,获得训练后的预测模型的预测值;根据预测值对训练后的预测模型进行迭代更新,直至达到训练停止条件。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对基于样本用户特征以及信用信息对预测模型进行训练做进一步详细说明。
模型训练平台将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,基于训练样本和样本标签生成训练数据集,并将训练数据集划分为训练数据子集以及测试数据子集。
模型训练平台通过该训练数据子集对预测模型进行训练,获得训练后的预测模型,并通过该测试数据子集对训练后的预测模型进行测试,获得训练后的预测模型的预测值。
判断该预测值与预设预测值进行比对,若比对结果为一致,则表示预测模型能够根据用户的特征预测出用户是否会逾期,从而达到训练停止条件,获得完成模型训练的预测模型。
若比对结果为不一致,则表示未到达训练停止条件,将预测模型的模型参数进行调整,继续对预测模型进行训练,直至预测模型的预测值与预设预测值的匹配结果为一致,从而达到训练停止条件。
本说明书实施例中,模型训练平台将根据训练数据子集对预测模型进行训练;并根据测试数据子集对训练后的预测模型进行测试,获得训练后的预测模型的预测值;根据预测值对所述训练后的预测模型进行迭代更新,直至达到训练停止条件。实现通过一个平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本,进一步节省了计算机处理资源,提高了模型训练的效率。
在本说明书一实施例中,所述根据所述预测值对所述训练后的预测模型进行迭代更新,直至达到训练停止条件之后,还包括:
接收待预测用户的用户特征,并将所述待预测用户的用户特征输入至所述预测模型,获得所述待预测用户的信用信息。
其中,待预测用户可以理解为需要通过预测模型进行预测的用户,在本说明书实施例中,模型训练平台完成对预测模型的训练之后,获得训练完成的预测模型,该训练完成的预测模型能够根据待预测用户的用户特征对待预测用户是否逾期进行预测,从而获得表征待预测用户是否会存在逾期问题的信用信息。
具体地,模型训练平台完成对预测模型的训练后,能够接收待预测用户的用户特征,并将待预测用户的用户特征输入至预测模型中,从而获得待预测用户的信用信息。
举例说明,以目标对象处理方法应用于对预测模型进行训练的场景为例,对通过预测模型获得待预测用户的信用信息进行进一步详细说明。
模型训练平台完成对预测模型的训练之后,能够获得训练完成的预测模型;
通过接收待预测用户的用户特征,并将该待预测用户的用户特征输入至训练完成的预测模型中进行预测,从而获得表征该待预测用户是否会逾期的信用信息,通过该信用信息能够判断出待预测用户在借款过程中是否会产生逾期的情况。
本说明书实施例中,通过接收待预测用户的用户特征,并将待预测用户的用户特征输入至预测模型,能够准确的获得待预测用户的信用信息。从而实现预先确定出借款过程中借款用户是否会产生逾期问题,降低了互联网金融企业的损失,对借款过程中的安全风险进行有效的控制。
本说明书实施例所提供的目标对象处理方法,仅通过一个对象处理平台,即可实现快速、准确的获取至少一个目标用户、每个目标用户的信用信息以及每个目标用户的用户特征,并根据每个目标用户的用户特征以及每个目标用户的信用信息,在对象处理平台上对目标对象进行处理,从而实现通过一个对象处理平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本,节省了计算机处理资源,提高了模型训练的效率。
下述结合附图3,以本说明书提供的目标对象处理方法在通过PAI平台实现对PD模型进行构建的场景下的应用为例,对所述目标对象处理方法进行进一步说明。其中,图3是本说明书一实施例提供的一种应用于通过PAI平台实现对PD模型进行构建的场景下的目标对象处理方法的处理流程图,具体包括以下步骤:
步骤302:PAI-样本定义。
具体的,在PAI平台上预先将历史样本数据进行数据标准化处理,调整历史样本数据的格式,生成通用的样本表,该样本为样本用户是否逾期;
在PD模型构建的样本定义环节,用户只需要向PAI平台的样本定义组件中输入训练样本的类型,即可获得PD模型的训练样本。
步骤304:PAI-特征拼接。
具体的,在PAI平台上预先将历史特征数据进行数据标准化处理,对历史特征的格式进行规整,生成通用的特征表;
在PD模型构建的特征拼接环节,通过自适应的特征拼接语句,即可通过通用的特征表,实现自动对特征进行拼接,无需人工指定字段。
步骤306:PAI-特征评估。
具体的,在PD模型构建的特征评估环节,能够根据PD模型的要求,通过PAI平台上封装的特征评估组件,自动计算出特征的质量评估值、IV值以及PSI值;通过质量评估值、IV值以及PSI值对特征的质量、预测能力以及稳定性进行评估;
基于评估结果对拼接后的特征进行筛选,获得有效的特征,并将无效的特征进行删除。
步骤308:PAI-模型训练。
具体的,在PD模型构建的模型训练环节,在PAI平台上将有效的特征作为训练样本,将从样本表中获取的样本作为标签;根据训练样本和标签生成训练数据集,并将训练数据集划分为训练数据子集以及测试数据子集。
在PAI平台上通过训练数据子集对PD模型进行训练,获得训练后的PD模型;根据测试数据子集对训练后的PD模型进行测试,获得PD模型输出的表征样本用户的是否逾期的预测结果;通过样本用户对应的标签判断PD模型的预测结果是否正确。
在PD模型输出的预测结果为正确的情况下,确定PD模型通过测试,从而完成对PD模型的训练。
步骤310:PAI-模型评估。
具体的,在PD模型构建的模型评估环节,在PAI平台上对训练完成的模型的性能和稳定性进行评估,同时将训练完成的模型的预测效果与基线模型的预测效果进行对比,从而对训练完成的模型的预测效果进行评估。
本说明书实施例中,PAI平台通过对历史样本以及历史用户特征进行数据标准化处理,使得用户通过PAI平台即可一站式完成样本定义以及特征拼接,减少跨平台操作的成本,避免了流程割裂的问题;并将模型训练过程中的处理逻辑封装成组件,使得用户不需要写一行代码,减少了模型构建的操作时长,从而节省了计算机处理资源,提高了模型训练的效率。
与上述方法实施例相对应,本说明书还提供了目标对象处理装置实施例,图4示出了本说明书一实施例提供的一种目标对象处理装置的结构示意图。如图4所示,该装置包括:
第一获取模块402,被配置为基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息;
第二获取模块404,被配置为基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征;
处理模块406,被配置为基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。
在本说明书一实施例中所述目标对象处理装置,还包括:
第一接收模块,被配置为接收携带有特征评估阈值的特征评估请求;
特征评估模块,被配置为基于所述特征评估请求对所述每个目标用户的用户特征进行评估,获得所述用户特征的评估值;
确定模块,被配置为在所述用户特征的评估值满足所述特征评估阈值的情况下,确定所述用户特征为目标用户特征。
在本说明书一实施例中,所述评估模块,还包括:
第一特征评估子模块,被配置为基于所述特征评估请求将所述每个目标用户的用户特征通过第一质量算法进行评估,获得所述用户特征的质量评估值;
第二特征评估子模块,被配置为基于所述特征评估请求将所述每个目标用户的用户特征通过第一有效性算法进行评估,获得所述用户特征的有效性评估值;
第三特征评估子模块,被配置为基于所述特征评估请求将所述每个目标用户的用户特征通过第一稳定性算法进行评估,获得所述用户特征的稳定性评估值。
在本说明书一实施例中,所述确定模块,还包括:
确定子模块,被配置为在所述用户特征的质量评估值满足质量评估阈值、所述用户特征的有效性评估值满足有效性评估阈值和所述用户特征的稳定性评估值满足稳定性评估阈值的情况下,确定所述用户特征为目标用户特征。
在本说明书一实施例中所述目标对象处理装置,还包括:
第二接收模块,被配置为基于接收到的对象评估请求从所述对象处理平台中获取评估数据;
对象评估模块,被配置为根据所述评估数据对处理后的目标对象进行评估。
在本说明书一实施例中所述对象评估模块,还包括:
获取评估值模块,被配置为基于所述评估数据与处理后的目标对象,获得针对所述处理后的目标对象的性能评估值;
对象评估子模块,被配置为基于所述评估数据对应的真实评估值和性能评估值对所述处理后的目标对象进行评估。
在本说明书一实施例中所述第一获取模块402,还包括:
获取样本用户信息模块,被配置为基于接收的目标属性信息从模型训练平台的样本用户信息表中,获取至少一个与所述目标属性信息对应的目标样本用户以及每个目标样本用户的信用信息,其中,所述样本用户信息表中存储多个样本用户以及每个样本用户的属性信息和信用信息。
在本说明书一实施例中所述第二获取模块404,还包括:
获取样本用户特征模块,被配置为基于所述至少一个目标样本用户的属性信息从所述模型训练平台的样本用户特征表中,获取每个目标样本用户的用户特征。
在本说明书一实施例中所述处理模块406,还包括:
模型训练模块,被配置为基于每个目标样本用户的用户特征以及每个目标样本用户的信用信息,对预测模型进行训练。
在本说明书一实施例中所述模型训练模块,还包括:
模型训练子模块,被配置为将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,基于所述训练样本和所述样本标签对所述预测模型进行训练。
在本说明书一实施例中所述模型训练子模块,还包括:
生成模块,被配置为基于所述训练样本和所述样本标签生成训练数据集,并将所述训练数据集划分为训练数据子集以及测试数据子集;
训练模块,被配置为根据所述训练数据子集对所述预测模型进行训练,获得训练后的预测模型;
验证模块,被配置为根据所述测试数据子集对所述训练后的预测模型进行测试,获得所述训练后的预测模型的预测值;
更新模块,被配置为根据所述预测值对所述训练后的预测模型进行迭代更新,直至达到训练停止条件。
在本说明书一实施例中,所述目标对象处理装置,还包括:
预测模块,被配置为接收待预测用户的用户特征,并将所述待预测用户的用户特征输入至所述预测模型,获得所述待预测用户的信用信息。
本说明书提供的目标对象处理装置,基于接收的目标属性信息从对象处理平台的用户信息表中快速、准确的获取至少一个目标用户以及每个目标用户的信用信息,并基于目标用户的属性信息从对象处理平台的用户特征表中快速、准确的获取每个目标用户的用户特征,从而实现通过一个平台完成对模型训练数据的构建以及对模型的训练,减少跨平台操作的成本。基于每个目标用户的用户特征以及每个目标用户的信用信息,对目标对象进行处理,从而节省了计算机处理资源,提高了模型训练的效率。
上述为本实施例的一种目标对象处理装置的示意性方案。需要说明的是,该目标对象处理装置的技术方案与上述的目标对象处理方法的技术方案属于同一构思,目标对象处理装置的技术方案未详细描述的细节内容,均可以参见上述目标对象处理方法的技术方案的描述。
图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备500还可以是移动式或静止式的服务器。
其中,处理器520用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现任意所述目标对象处理方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的目标对象处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述目标对象处理方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现任意所述目标对象处理方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的目标对象处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述目标对象处理方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书并不受所描述的动作顺序的限制,因为依据本说明书,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (15)
1.一种目标对象处理方法,应用于对象处理平台,包括:
基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息;
基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征;
基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。
2.根据权利要求1所述的目标对象处理方法,所述获取每个目标用户的用户特征之后,还包括:
接收携带有特征评估阈值的特征评估请求;
基于所述特征评估请求对所述每个目标用户的用户特征进行评估,获得所述用户特征的评估值;
在所述用户特征的评估值满足所述特征评估阈值的情况下,确定所述用户特征为目标用户特征。
3.根据权利要求2所述的目标对象处理方法,所述基于所述特征评估请求对所述每个目标用户的用户特征进行评估,获得所述用户特征的评估值,包括:
基于所述特征评估请求将所述每个目标用户的用户特征通过第一质量算法进行评估,获得所述用户特征的质量评估值;
基于所述特征评估请求将所述每个目标用户的用户特征通过第一有效性算法进行评估,获得所述用户特征的有效性评估值;
基于所述特征评估请求将所述每个目标用户的用户特征通过第一稳定性算法进行评估,获得所述用户特征的稳定性评估值。
4.根据权利要求3所述的目标对象处理方法,所述在所述用户特征的评估值满足所述特征评估阈值的情况下,确定所述用户特征为目标用户特征,包括:
在所述用户特征的质量评估值满足质量评估阈值、所述用户特征的有效性评估值满足有效性评估阈值和所述用户特征的稳定性评估值满足稳定性评估阈值的情况下,确定所述用户特征为目标用户特征。
5.根据权利要求1所述的目标对象处理方法,所述对所述目标对象进行处理之后,还包括:
基于接收到的对象评估请求从所述对象处理平台中获取评估数据;
根据所述评估数据对处理后的目标对象进行评估。
6.根据权利要求5所述的目标对象处理方法,所述根据所述评估数据对处理后的目标对象进行评估,包括:
基于所述评估数据与处理后的目标对象,获得针对所述处理后的目标对象的性能评估值;
基于所述评估数据对应的真实评估值和性能评估值对所述处理后的目标对象进行评估。
7.根据权利要求1或6任意一项所述的目标对象处理方法,所述基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,包括:
基于接收的目标属性信息从模型训练平台的样本用户信息表中,获取至少一个与所述目标属性信息对应的目标样本用户以及每个目标样本用户的信用信息,其中,所述样本用户信息表中存储多个样本用户以及每个样本用户的属性信息和信用信息。
8.根据权利要求7所述的目标对象处理方法,所述基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征,包括:
基于所述至少一个目标样本用户的属性信息从所述模型训练平台的样本用户特征表中,获取每个目标样本用户的用户特征。
9.根据权利要求8所述的目标对象处理方法,所述基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理,包括:
基于每个目标样本用户的用户特征以及每个目标样本用户的信用信息,对预测模型进行训练。
10.根据权利要求9所述的目标对象处理方法,所述基于每个目标样本用户的用户特征以及每个目标样本用户的信用信息,对所述预测模型进行训练,包括:
将每个目标样本用户的用户特征作为训练样本,将每个目标样本用户的信用信息作为样本标签,基于所述训练样本和所述样本标签对所述预测模型进行训练。
11.根据权利要求10所述的目标对象处理方法,所述基于所述训练样本和所述样本标签对所述预测模型进行训练,包括:
基于所述训练样本和所述样本标签生成训练数据集,并将所述训练数据集划分为训练数据子集以及测试数据子集;
根据所述训练数据子集对所述预测模型进行训练,获得训练后的预测模型;
根据所述测试数据子集对所述训练后的预测模型进行测试,获得所述训练后的预测模型的预测值;
根据所述预测值对所述训练后的预测模型进行迭代更新,直至达到训练停止条件。
12.根据权利要求11所述的目标对象处理方法,所述根据所述预测值对所述训练后的预测模型进行迭代更新,直至达到训练停止条件之后,还包括:
接收待预测用户的用户特征,并将所述待预测用户的用户特征输入至所述预测模型,获得所述待预测用户的信用信息。
13.一种目标对象处理装置,包括:
第一获取模块,被配置为基于接收的目标属性信息从所述对象处理平台的用户信息表中,获取至少一个与所述目标属性信息对应的目标用户以及每个目标用户的信用信息,其中,所述用户信息表中存储多个用户以及每个用户的属性信息和信用信息;
第二获取模块,被配置为基于所述至少一个目标用户的属性信息从所述对象处理平台的用户特征表中,获取每个目标用户的用户特征;
处理模块,被配置为基于每个目标用户的用户特征以及每个目标用户的信用信息,对所述目标对象进行处理。
14.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1-12任意一项所述目标对象处理方法的步骤。
15.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1-12任意一项所述目标对象处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110780307.8A CN113536672B (zh) | 2021-07-09 | 2021-07-09 | 目标对象处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110780307.8A CN113536672B (zh) | 2021-07-09 | 2021-07-09 | 目标对象处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113536672A true CN113536672A (zh) | 2021-10-22 |
CN113536672B CN113536672B (zh) | 2024-05-31 |
Family
ID=78098404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110780307.8A Active CN113536672B (zh) | 2021-07-09 | 2021-07-09 | 目标对象处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113536672B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109426894A (zh) * | 2017-08-22 | 2019-03-05 | 阿里巴巴集团控股有限公司 | 用户信息共享、竞价方法、装置、系统及电子设备 |
US20190279297A1 (en) * | 2017-02-08 | 2019-09-12 | Tencent Technology (Shenzhen) Company Limited | Credit scoring method and server |
CN110457576A (zh) * | 2019-07-08 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 账户分类方法、装置、计算机设备和存储介质 |
CN110992169A (zh) * | 2019-11-29 | 2020-04-10 | 深圳乐信软件技术有限公司 | 一种风险评估方法、装置、服务器及存储介质 |
CN111080338A (zh) * | 2019-11-11 | 2020-04-28 | 中国建设银行股份有限公司 | 用户数据的处理方法、装置、电子设备及存储介质 |
CN111833179A (zh) * | 2020-07-17 | 2020-10-27 | 浙江网商银行股份有限公司 | 资源分配平台、资源分配方法及装置 |
US20210166140A1 (en) * | 2018-12-13 | 2021-06-03 | Advanced New Technologies Co., Ltd. | Method and apparatus for training risk identification model and server |
CN113034260A (zh) * | 2019-12-09 | 2021-06-25 | 中国移动通信有限公司研究院 | 一种信用评估方法、模型构建方法、显示方法及相关设备 |
CN113052422A (zh) * | 2019-12-28 | 2021-06-29 | 中移(成都)信息通信科技有限公司 | 风控模型训练方法和用户信用评估方法 |
-
2021
- 2021-07-09 CN CN202110780307.8A patent/CN113536672B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190279297A1 (en) * | 2017-02-08 | 2019-09-12 | Tencent Technology (Shenzhen) Company Limited | Credit scoring method and server |
CN109426894A (zh) * | 2017-08-22 | 2019-03-05 | 阿里巴巴集团控股有限公司 | 用户信息共享、竞价方法、装置、系统及电子设备 |
US20210166140A1 (en) * | 2018-12-13 | 2021-06-03 | Advanced New Technologies Co., Ltd. | Method and apparatus for training risk identification model and server |
CN110457576A (zh) * | 2019-07-08 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 账户分类方法、装置、计算机设备和存储介质 |
CN111080338A (zh) * | 2019-11-11 | 2020-04-28 | 中国建设银行股份有限公司 | 用户数据的处理方法、装置、电子设备及存储介质 |
CN110992169A (zh) * | 2019-11-29 | 2020-04-10 | 深圳乐信软件技术有限公司 | 一种风险评估方法、装置、服务器及存储介质 |
CN113034260A (zh) * | 2019-12-09 | 2021-06-25 | 中国移动通信有限公司研究院 | 一种信用评估方法、模型构建方法、显示方法及相关设备 |
CN113052422A (zh) * | 2019-12-28 | 2021-06-29 | 中移(成都)信息通信科技有限公司 | 风控模型训练方法和用户信用评估方法 |
CN111833179A (zh) * | 2020-07-17 | 2020-10-27 | 浙江网商银行股份有限公司 | 资源分配平台、资源分配方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113536672B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112785086A (zh) | 信贷逾期风险预测方法及装置 | |
CN111191871A (zh) | 项目基线数据生成方法、装置、计算机设备和存储介质 | |
CN110070452B (zh) | 模型训练方法、装置、计算设备及计算机可读存储介质 | |
CN112015747A (zh) | 数据上传方法及装置 | |
CN111582341B (zh) | 用户异常操作预测方法及装置 | |
CN111340558A (zh) | 基于联邦学习的线上信息处理方法、装置、设备及介质 | |
CN111738331A (zh) | 用户分类方法及装置、计算机可读存储介质、电子设备 | |
CN111815169A (zh) | 业务审批参数配置方法及装置 | |
CN112016855B (zh) | 基于关系网匹配的用户行业识别方法、装置和电子设备 | |
CN111949795A (zh) | 工单自动分类方法及装置 | |
CN111199469A (zh) | 用户还款模型生成方法、装置及电子设备 | |
CN112632179A (zh) | 模型构建方法、装置、存储介质及设备 | |
CN112884569A (zh) | 一种信用评估模型的训练方法、装置及设备 | |
CN113221989B (zh) | 基于分布式的评估模型训练方法、系统以及装置 | |
CN112015870B (zh) | 数据上传方法及装置 | |
KR102152081B1 (ko) | 딥러닝 기반의 가치 평가 방법 및 그 장치 | |
CN113536672B (zh) | 目标对象处理方法及装置 | |
WO2024065776A1 (en) | Method for data processing, apparatus for data processing, electronic device, and storage medium | |
CN113296836B (zh) | 训练模型的方法、测试方法、装置、电子设备及存储介质 | |
CN115375965A (zh) | 一种目标场景识别的预处理方法、目标场景识别方法 | |
CN115099934A (zh) | 一种高潜客户识别方法、电子设备和存储介质 | |
CN115048996A (zh) | 质量评估模型训练和使用方法、设备及存储介质 | |
CN115222370A (zh) | 多维度创业孵化项目评测方法、系统及电子设备 | |
CN112286571A (zh) | 漏洞修复方法、装置及存储介质 | |
CN111881008A (zh) | 一种数据评测、模型训练方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |