CN112116405B - 数据处理方法、装置、电子设备及介质 - Google Patents

数据处理方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN112116405B
CN112116405B CN202011046746.8A CN202011046746A CN112116405B CN 112116405 B CN112116405 B CN 112116405B CN 202011046746 A CN202011046746 A CN 202011046746A CN 112116405 B CN112116405 B CN 112116405B
Authority
CN
China
Prior art keywords
user
loss probability
data
probability
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011046746.8A
Other languages
English (en)
Other versions
CN112116405A (zh
Inventor
梁亮
李婷姝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202011046746.8A priority Critical patent/CN112116405B/zh
Publication of CN112116405A publication Critical patent/CN112116405A/zh
Application granted granted Critical
Publication of CN112116405B publication Critical patent/CN112116405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本申请提供了数据处理方法、装置、电子设备及介质,该方法首先获取第一用户的数据集合,然后利用两种方式计算得到第一用户的用户流失概率,第一种方式为:基于第一用户的数据集合与各第二用户的数据集合之间的距离,确定第一用户流失概率;第二种方式为:基于M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到第三用户流失概率;有可能因为突发事件导致用户不再使用支付卡,因此,需要确定第一用户因突发事件成为流失客户的用户流失概率。基于该用户流失概率、第一用户流失概率和第三用户流失概率,得到的最终用户流失概率,由于考虑了突发事件对第一用户的影响,以及第一用户自身使用支付卡的情况,所以最终用户流失概率更加准确。

Description

数据处理方法、装置、电子设备及介质
技术领域
本申请涉及大数据技术领域,更具体的说,是涉及数据处理方法、装置、电子设备及介质。
背景技术
用户可以持支付卡(例如信用卡或借记卡)进行消费或存款,例如,用户可以利用借记卡进行存款或消费,用户可以利用信用卡提前进行消费。
目前用户可能因为某些原因不再使用支付卡,而对支付卡进行销户,因此,需要维护这些可能流失的用户。
综上,如何确定用户是否为流失客户是本领域技术人员急需解决的难题。
发明内容
有鉴于此,本申请提供了一种数据处理方法、装置、电子设备及介质。
为实现上述目的,本申请提供如下技术方案:
根据本公开实施例的第一方面,提供一种数据处理方法,包括:
获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
在第一方面的第一种实现方式中,还包括:
若所述最终用户流失概率大于或等于预设阈值,确定所述第一用户为待维护用户。
在第一方面的第二种实现方式中,所述从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合步骤包括:
从所述各第二用户分别对应的数据集合中随机选取所述预设数目个数据集合;
计算所述第一用户的数据集合分别与所述预设数目个数据集合的第一距离;
将所述预设数目个数据集合以及所述预设数目个数据集合分别对应的第一距离存储至优先级队列;
从所述各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合;
计算所述第一用户的数据集合与所述目标数据集合的第二距离;
从所述优先级队列存储的所述预设数目个数据集合分别对应的第一距离中获取最大距离;
若所述最大距离大于所述第二距离,删除所述优先级队列中所述最大距离对应的数据集合以及所述最大距离,将所述目标数据集合的标号以及所述第二距离存储至所述优先级队列;
返回步骤从所述各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合,直至各第二用户分别对应的数据集合均被选取过一次。
在第一方面的第三种实现方式中,还包括:
将各第二用户分别对应的数据集合以及各第二用户分别对应的所述第一信息输入至回归模型,其中,一个所述第二用户的数据集合为自变量,一个所述第二用户的数据集合对应的所述第一信息为所述第二用户的数据集合的因变量;
获得所述回归模型输出的M个数据所属字段分别对应的回归系数。
根据本公开实施例的第二方面,提供一种数据处理装置,包括:
第一获取模块,用于获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
第二获取模块,用于从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
第一确定模块,用于基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
第二确定模块,用于基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
第三确定模块,用于将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
计算模块,用于基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
第四确定模块,用于基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
第五确定模块,用于将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
第六确定模块,用于基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
在第二方面的第一种实现方式中,还包括:
第七确定模块,用于若所述最终用户流失概率大于或等于预设阈值,确定所述第一用户为待维护用户。
在第二方面的第二种实现方式中,所述第二获取模块包括:
第一选取单元,用于从所述各第二用户分别对应的数据集合中随机选取所述预设数目个数据集合;
第一计算单元,用于计算所述第一用户的数据集合分别与所述预设数目个数据集合的第一距离;
存储单元,用于将所述预设数目个数据集合以及所述预设数目个数据集合分别对应的第一距离存储至优先级队列;
第二选取单元,用于从所述各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合;
第二计算单元,用于计算所述第一用户的数据集合与所述目标数据集合的第二距离;
第一获取单元,用于从所述优先级队列存储的所述预设数目个数据集合分别对应的第一距离中获取最大距离;
处理单元,用于若所述最大距离大于所述第二距离,删除所述优先级队列中所述最大距离对应的数据集合以及所述最大距离,将所述目标数据集合的标号以及所述第二距离存储至所述优先级队列;
返回单元,用于若触发所述第二选取单元,直至所述各第二用户分别对应的数据集合均被选取过一次。
在第二方面的第三种实现方式中,还包括:
输入模块,用于将各第二用户分别对应的数据集合以及各第二用户分别对应的所述第一信息输入至回归模型,其中,一个所述第二用户的数据集合为自变量,一个所述第二用户的数据集合对应的所述第一信息为所述第二用户的数据集合的因变量;
第三获取模块,用于获得所述回归模型输出的M个数据所属字段分别对应的回归系数。
根据本公开实施例的第三方面,提供一种电子设备,包括:
存储器,用于存储程序;
处理器,用于执行所述程序,所述程序具体用于:
获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
根据本公开实施例的第四方面,提供一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如第一方面所述的数据处理方法中的各个步骤。
经由上述的技术方案可知,与现有技术相比,本申请提供的数据处理方法中,首先获取第一用户的数据集合,然后,利用两种方式分别计算得到第一用户对应的用户流失概率,第一种计算方式为:基于第一用户的数据集合与各第二用户的数据集合之间的距离,确定所述第一用户对应的第一用户流失概率;第二种计算方式为:基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率;可以理解的是,还有可能因为突发事件导致用户不再使用支付卡,即对支付卡进行销户,因此,还需要基于至少一个突发事件分别对应的预设概率,确定第一用户因所述至少一个突发事件成为流失客户的用户流失概率。基于第一用户因所述至少一个突发事件成为流失客户的用户流失概率、第一用户流失概率和第三用户流失概率,得到的最终用户流失概率,由于考虑了突发事件对第一用户的影响,以及第一用户自身使用支付卡的情况,所以最终用户流失概率更加准确。可以基于最终用户流失概率确定第一用户是否为需要维护的用户。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种实施环境的架构图;
图2为本申请实施例提供的数据处理方法的一种流程图;
图3为本申请实施例提供的误差曲线的示意图;
图4为本申请实施例提供的一种数据处理装置的结构图;
图5为本申请实施例提供的电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种数据处理方法、装置、电子设备及存储介质。
在介绍本申请实施例提供的技术方案之前,先介绍本申请实施例涉及的实施环境。
请参阅附图1,为本申请公开的一种实施环境的架构图,该实施环境包括:电子设备11、第一数据库12以及第二数据库13。
可选的,电子设备11可以为任何一个可与用户通过键盘、触摸板、触摸屏、遥控器或手写设备等一种或多种方式进行人机交互的电子产品,例如,手机、平板电脑、掌上电脑、手提电脑、个人计算机、可穿戴设备、智能电视等
可选的,电子设备11可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
可选的,第一数据库12和第二数据库13可以为一个数据库,也可以为不同数据库。
可选的,第一数据库12和第二数据库13中至少一个数据库属于电子设备11。
可选的,第一数据库12和第二数据库13独立于电子设备11之外。
其中,第一数据库12存储有各第二用户分别对应的数据集合,以及,各第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息。
第二数据库13存储有M个字段分别对应的预设回归系数。
M为大于或等于1的正整数。
示例性的,一个字段可以为用户的支付卡的在预设时间段内的使用频率、用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内用户对应的关联用户中持有支付卡的用户数目中任一个。
电子设备11可以获得第一用户的数据集合,该数据集合包括M个字段分别对应的字段值。电子设备可以基于第一数据库12以及第二数据库13得到第一用户对应的最终用户流失概率。
示例性的,一个第二用户可能已经是支付卡的流失客户(即已针对该支付卡进行销户),或,不是支付卡的流失客户(即未针对该支付卡进行销户)。
示例性的,为了保证第二用户的数据集合的稳定性,第二用户持有支付卡的时长远远大于第一用户持有支付卡的时长。
本申请实施例中,银行人员可以基于第一用户对应的最终用户流失概率,确定是否对第一用户进行维护。例如,若所述最终用户流失概率大于或等于预设阈值,确定所述第一用户为待维护用户。
下面结合附图对本申请实施例提供的数据处理方法进行说明。
如图2所示,为本申请实施例提供的数据处理方法的一种流程图,该方法在实施过程中包括以下步骤S201至步骤S209。
步骤S201:获取第一用户的数据集合。
示例性的,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据。M为大于或等于1的正整数。
示例性的,第一用户的数据集合可以存储在第一数据库12中。
在一可选实现方式中,预设时间段的最晚时间为当前时间,预设时间段的时长可以为1年、2年、3年,…,等。例如,假设当前时间为2020年9月,预设时间段的时长为5年,那么,预设时间段为2016年9月至2020年9月。
在一可选实现方式中,支付卡的类型不同,数据集合包含的数据的种类可能不同。例如,若支付卡为借记卡,一个用户的数据集合还可以包括:在所述预设时间段内用户在所述借记卡中的存款数额。
下面对“在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目”进行说明。
用户对应的关联用户可以为与用户的配偶、子女、父母、同事、同学、朋友中的一种或多种。
示例性的,可以基于通过读取用户的电子设备中的联系人,获得用户对应的关联用户。
步骤S202:从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合。
示例性的,一个第二用户持有支付卡的时长大于第一用户持有支付卡的时长。例如,第二用户持有自己的支付卡的时长为10年,第一用户持有自己的支付卡的时长为5年。
示例性的,一个所述第二用户持有所述支付卡的时长小于所述第一用户持有所述支付卡的时长。
示例性的,一个第二用户持有支付卡的时长和第一用户持有支付卡的时长无关联。
示例性的,上述第一用户的数据集合与第二用户的数据集合的距离,可以为欧式距离、曼哈顿距离以及海明距离中的至少一种。
下面以曼哈顿距离为例进行说明。
第一用户的数据集合与第二用户的数据集合的距离为
其中,xi为第一用户的数据集合中第i个数据,i取值从1至M。yi为第二用户的数据集合中第i个数据。xi与yi对应同一字段。
示例性的,预设数目可以基于实际情况而定。预设数目可以为任一正整数。
步骤S203:基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率。
示例性的,预设数目的具体数值,决定了第一用户流失概率的准确性。
可以理解的是,若预设数目过小,会发生过拟合;如果预设数目太大,则会发生欠拟合。因此,可以采用以下方法确定预设数目,该方法包括步骤A1至步骤A3。
步骤A1:设定K1、K2、K3、…Kn,其中n为大于或等于1的任意正整数。
步骤A2:针对每一Kj,其中,j的取值为1至n,执行以下操作。
步骤A3:对L个测试用户中每一测试用户执行以下操作:
从各第二用户分别对应的数据集合中,确定Kj个与测试用户的数据集合距离最小的第二用户对应的数据集合。
示例性的,L为大于或等于1的正整数。
步骤A4:基于步骤A3确定的Kj个第二用户分别对应的第一信息,确定测试用户对应的用户流失概率1。
示例性的,测试用户可以为各第二用户中任一第二用户。
示例性的,用户流失概率1=步骤A3确定的Kj个第二用户分别对应的第一信息中表征用户已是支付卡的流失客户的第一信息的数目/Kj。
步骤A5:计算用户流失概率1与测试用户对应的第一信息的误差。
示例性的,误差=|用户流失概率1-第一信息对应的数值|,示例性的,若测试用户是支付卡已流失客户,则第一信息对应的数值为1;若测试用户不是支付卡已流失客户,则第一信息对应的数值为0。
步骤A6:基于步骤A3至步骤A5,获得在Kj下的L个测试用户分别对应的误差,将L个误差的平均值作为Kj对应的目标误差。
步骤A7:基于K1、K2、K3、…Kn分别对应的目标误差,绘制误差曲线。
如图3所示,为本申请实施例提供的误差曲线的示意图。
图3中误差曲线的横坐标为K值,纵坐标为目标误差。
步骤A7:将误差曲线中最小纵坐标对应的目标误差确定为预设数目。
仍以图3为例,图3中A点即为最小纵坐标对应的点,A的横坐标即为预设数目。
示例性的,步骤S203的具体实现公式可以如下:
第一用户流失概率=预设数目个目标第二用户中对应的第一信息中表征为该支付卡已流失客户的第一信息的数目/预设数目。
例如,预设数目为10,假设10个目标第二用户中对应的第一信息中表征为该支付卡已流失客户的第一信息的数目为7,那么,第一用户流失概率为70%。
步骤S204:基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率。
可以理解的是,有可能因为突发事件导致用户不再使用支付卡,即对支付卡进行销户。
示例性的,突发事件为可以为:针对一次交易重复扣款事件、强行绑定业务事件、还款失败次数较多事件中的至少一种。
其中,针对一次交易重复扣款事件是指,用户执行一次交易,应该仅扣除一次款项,但是发生了重复多次扣款的情况。
强行绑定业务事件是指,在利用支付卡进行交易或存款时,必须绑定某一项或多项业务,导致用户反感的情况。
还款失败次数较多事件是指,若支付卡为信用卡,用户在进行还款时,需要多次执行还款操作,才能够还款成功。
示例性的,可以基于往年上述突发事件的发生概率,设定这些突发事件将来可能发生的预设概率。
示例性的,假设共有Q个突发事件,Q为大于或等于1的任意正整数,且,突发事件i对应预设概率i;可以基于以下公式计算得到第二用户流失概率:
第二用户流失概率=(1-第一用户流失概率)*(突发事件1*预设概率1+突发事件2*预设概率2+…+突发事件Q*预设概率Q)。
示例性的,可以基于以下公式计算得到第二用户流失概率:
第二用户流失概率=(1-第一用户流失概率)*(突发事件1*预设概率1+突发事件2*预设概率2+…+突发事件Q*预设概率Q)/Q。
步骤S205:将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率。
步骤S206:基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率。
一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度。
示例性的,一个字段的预设回归系数可以是人为基于经验设定的。
假设M个字段分别对应的预设回归系数分别为β0,β1,…,βM,且第三用户流失概率=β01*X12*X 23*X 3+,…,+βM*X M+εi。其中,X1至X M为M个字段,εi是相互独立且服从同一正态分布N(0,σ2)的随机变量。
将第一用户的M个字段分别对应的数据带入上述方程式,就可以计算得到第三用户流失概率。
步骤S202与步骤S206没有先后执行顺序,例如,可以先执行步骤S206,也可以先执行步骤S202,也可以同时执行步骤S202和步骤S206。
步骤S207:基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率。
示例性的,假设共有Q个突发事件,Q为大于或等于1的任意正整数,且,突发事件i对应预设概率i;可以基于以下公式计算得到第四用户流失概率:
第四用户流失概率=(1-第三用户流失概率)*(突发事件1*预设概率1+突发事件2*预设概率2+…+突发事件Q*预设概率Q)。
示例性的,可以基于以下公式计算得到第四用户流失概率:
第四用户流失概率=(1-第三用户流失概率)*(突发事件1*预设概率1+突发事件2*预设概率2+…+突发事件Q*预设概率Q)/Q。
步骤S208:将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率。
步骤S209:基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
在一可选实现方式中,最终用户流失概率=(第一目标用户流失概率+第二目标用户流失概率)/2。
在一可选实现方式中,若称步骤S202至步骤S203为第一种计算方式,称步骤S206为第二种计算方式,可以为第一种计算方式和第二种计算方式设置权重,假设为第一种计算方式设置第一权重,为第二种计算方式设置第二权重,那么,最终用户流失概率=第一目标用户流失概率*第一权重+第二目标用户流失概率*第二权重。
本申请实施例提供的数据处理方法中,首先获取第一用户的数据集合,然后,利用两种方式分别计算得到第一用户对应的用户流失概率,第一种计算方式为:基于第一用户的数据集合与各第二用户的数据集合之间的距离,确定所述第一用户对应的第一用户流失概率;第二种计算方式为:基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率;可以理解的是,还有可能因为突发事件导致用户不再使用支付卡,即对支付卡进行销户,因此,还需要基于至少一个突发事件分别对应的预设概率,确定第一用户因所述至少一个突发事件成为流失客户的用户流失概率。基于第一用户因所述至少一个突发事件成为流失客户的用户流失概率、第一用户流失概率和第三用户流失概率,得到的最终用户流失概率,由于考虑了突发事件对第一用户的影响,以及第一用户自身使用支付卡的情况,所以最终用户流失概率更加准确。可以基于最终用户流失概率确定第一用户是否为需要维护的用户。
示例性的,本申请实施例还提供了以下方法:若所述最终用户流失概率大于或等于预设阈值,确定所述第一用户为待维护用户。
示例性的,预设阈值可以基于实际情况而定,这里不进行限定。
示例性的,若所述最终用户流失概率大于或等于预设阈值,将第一用户的通讯信息存储至预设表格。
示例性的,通讯信息包括:手机号、邮箱、座机、家庭住址中的一种或多种。
在一可选实现方式中,步骤S202的实现方式有多种,本申请实施例提供但不限于以下方式。该方法包括步骤B1至步骤B8。
步骤B1:从各第二用户分别对应的数据集合中随机选取所述预设数目个数据集合。
假设各第二用户共有P个,分别为第二用户1、第二用户2、第二用户3,…,第二用户P。假设预设数目为9个,随机选取的9个数据集合分别为:第二用户1的数据集合、第二用户2的数据集合,…,第二用户9的数据集合。
步骤B2:计算所述第一用户的数据集合分别与所述预设数目个数据集合的第一距离。
步骤B3:将所述预设数目个数据集合以及所述预设数目个数据集合分别对应的第一距离存储至优先级队列。
仍以P个第二用户为例,假设第一用户的数据集合与9个数据集合的第一距离,分别为第一距离1(对应第二用户1)、第一距离2(对应第二用户2),…,第一距离9(对应第二用户9)。
示例性的,将第二用户h的数据集合以及相应的第一距离h作为优先级队列的一个元素,存储至优先级队列。h的取值从1至9。
步骤B4:从各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合。
在第一次执行步骤B4时,由于第二用户1至第二用户9的数据集合已经被选取过,第二用户10的数据集合至第二用户P的数据集合是未被选取过的,因此,从第二用户10的数据集合至第二用户P的数据集合中选取一个目标数据集合。
步骤B5:计算所述第一用户的数据集合与所述目标数据集合的第二距离。
步骤B6:从所述优先级队列存储的所述预设数目个数据集合分别对应的第一距离中获取最大距离。
步骤B7:若所述最大距离大于所述第二距离,删除所述优先级队列中所述最大距离对应的数据集合以及所述最大距离,将所述目标数据集合的标号以及所述第二距离存储至所述优先级队列。
示例性的,若所述最大距离小于或等于第二距离,执行步骤B8。
步骤B8:返回步骤B4,直至各第二用户分别对应的数据集合均被选取过一次。
在一可选实现方式中,M个数据所属字段分别对应的预设回归系数的获取方法包括以下步骤C1至步骤C2。
步骤C1:将各第二用户分别对应的数据集合以及各第二用户分别对应的所述第一信息输入至回归模型,其中,一个所述第二用户的数据集合为自变量,一个所述第二用户的数据集合对应的所述第一信息为所述第二用户的数据集合的因变量。
回归模型(regression model)是对统计关系进行定量描述的一种数学模型。如多元线性回归的数学模型可以表示为y=β01*X12*X 23*X 3+,…,+βM*X M+εi,式中,β0,β1,…,βM,εi是M+2个待估计的参数,εi是相互独立且服从同一正态分布N(0,σ2)的随机变量,y是因变量;x是自变量,β0,β1,…,βM称为回归系数,表征自变量对因变量影响的程度。
其中,X1至X M为M个字段。
步骤C2:获得所述回归模型输出的M个数据分别对应的回归系数。
上述本申请公开的实施例中详细描述了方法,对于本申请的方法可采用多种形式的装置实现,因此本申请还公开了多种装置,下面给出具体的实施例进行详细说明。
如图4所示,为本申请实施例提供的一种数据处理装置的结构图,该装置包括第一获取模块41、第二获取模块42、第一确定模块43、第二确定模块44、第三确定模块45、计算模块46、第四确定模块47、第五确定模块48以及第六确定模块49,其中:
第一获取模块41,用于获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
第二获取模块42,用于从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
第一确定模块43,用于基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
第二确定模块44,用于基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
第三确定模块45,用于将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
计算模块46,用于基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
第四确定模块47,用于基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
第五确定模块48,用于将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
第六确定模块49,用于基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
在一可选实现方式中,数据处理装置还包括:
第七确定模块,用于若所述最终用户流失概率大于或等于预设阈值,确定所述第一用户为待维护用户。
在一可选实现方式中,所述第二获取模块包括:
第一选取单元,用于从所述各第二用户分别对应的数据集合中随机选取所述预设数目个数据集合;
第一计算单元,用于计算所述第一用户的数据集合分别与所述预设数目个数据集合的第一距离;
存储单元,用于将所述预设数目个数据集合以及所述预设数目个数据集合分别对应的第一距离存储至优先级队列;
第二选取单元,用于从所述各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合;
第二计算单元,用于计算所述第一用户的数据集合与所述目标数据集合的第二距离;
第一获取单元,用于从所述优先级队列存储的所述预设数目个数据集合分别对应的第一距离中获取最大距离;
处理单元,用于若所述最大距离大于所述第二距离,删除所述优先级队列中所述最大距离对应的数据集合以及所述最大距离,将所述目标数据集合的标号以及所述第二距离存储至所述优先级队列;
返回单元,用于若触发所述第二选取单元,直至所述各第二用户分别对应的数据集合均被选取过一次。
在一可选实现方式中,数据处理装置还包括:
输入模块,用于将各第二用户分别对应的数据集合以及各第二用户分别对应的所述第一信息输入至回归模型,其中,一个所述第二用户的数据集合为自变量,一个所述第二用户的数据集合对应的所述第一信息为所述第二用户的数据集合的因变量;
第三获取模块,用于获得所述回归模型输出的M个数据所属字段分别对应的回归系数。
如图5所示,为本申请实施例提供的电子设备的结构图,电子设备包括:
存储器51,用于存储程序;
处理器52,用于执行所述程序,所述程序具体用于:
获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
处理器52可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)。
电子设备还可以包括通信接口53以及通信总线54,其中,存储器51、处理器52以及通信接口53通过通信总线54完成相互间的通信。
本申请实施例还提供了一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如上述任一项所述的数据处理方法中的各个步骤。
需要说明的是,本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
2.根据权利要求1所述数据处理方法,其特征在于,还包括:
若所述最终用户流失概率大于或等于预设阈值,确定所述第一用户为待维护用户。
3.根据权利要求1所述数据处理方法,其特征在于,所述从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合步骤包括:
从所述各第二用户分别对应的数据集合中随机选取所述预设数目个数据集合;
计算所述第一用户的数据集合分别与所述预设数目个数据集合的第一距离;
将所述预设数目个数据集合以及所述预设数目个数据集合分别对应的第一距离存储至优先级队列;
从所述各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合;
计算所述第一用户的数据集合与所述目标数据集合的第二距离;
从所述优先级队列存储的所述预设数目个数据集合分别对应的第一距离中获取最大距离;
若所述最大距离大于所述第二距离,删除所述优先级队列中所述最大距离对应的数据集合以及所述最大距离,将所述目标数据集合的标号以及所述第二距离存储至所述优先级队列;
返回步骤从所述各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合,直至各第二用户分别对应的数据集合均被选取过一次。
4.根据权利要求1至3任一所述数据处理方法,其特征在于,还包括:
将各第二用户分别对应的数据集合以及各第二用户分别对应的所述第一信息输入至回归模型,其中,一个所述第二用户的数据集合为自变量,一个所述第二用户的数据集合对应的所述第一信息为所述第二用户的数据集合的因变量;
获得所述回归模型输出的M个数据所属字段分别对应的回归系数。
5.一种数据处理装置,其特征在于,包括:
第一获取模块,用于获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
第二获取模块,用于从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
第一确定模块,用于基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
第二确定模块,用于基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
第三确定模块,用于将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
计算模块,用于基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
第四确定模块,用于基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
第五确定模块,用于将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
第六确定模块,用于基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
6.根据权利要求5所述数据处理装置,其特征在于,还包括:
第七确定模块,用于若所述最终用户流失概率大于或等于预设阈值,确定所述第一用户为待维护用户。
7.根据权利要求5所述数据处理装置,其特征在于,所述第二获取模块包括:
第一选取单元,用于从所述各第二用户分别对应的数据集合中随机选取所述预设数目个数据集合;
第一计算单元,用于计算所述第一用户的数据集合分别与所述预设数目个数据集合的第一距离;
存储单元,用于将所述预设数目个数据集合以及所述预设数目个数据集合分别对应的第一距离存储至优先级队列;
第二选取单元,用于从所述各第二用户分别对应的数据集合中选取一个未选取过的目标数据集合;
第二计算单元,用于计算所述第一用户的数据集合与所述目标数据集合的第二距离;
第一获取单元,用于从所述优先级队列存储的所述预设数目个数据集合分别对应的第一距离中获取最大距离;
处理单元,用于若所述最大距离大于所述第二距离,删除所述优先级队列中所述最大距离对应的数据集合以及所述最大距离,将所述目标数据集合的标号以及所述第二距离存储至所述优先级队列;
返回单元,用于若触发所述第二选取单元,直至所述各第二用户分别对应的数据集合均被选取过一次。
8.根据权利要求5至7任一所述数据处理装置,其特征在于,还包括:
输入模块,用于将各第二用户分别对应的数据集合以及各第二用户分别对应的所述第一信息输入至回归模型,其中,一个所述第二用户的数据集合为自变量,一个所述第二用户的数据集合对应的所述第一信息为所述第二用户的数据集合的因变量;
第三获取模块,用于获得所述回归模型输出的M个数据所属字段分别对应的回归系数。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述程序,所述程序具体用于:
获取第一用户的数据集合,一个用户对应的所述数据集合包括所述用户的支付卡的在预设时间段内的使用频率、所述用户针对所述支付卡在所述预设时间段内的贷款金额,以及,在所述预设时间段内所述用户对应的关联用户中持有支付卡的用户数目中的M个数据,M为大于或等于1的正整数;
从各第二用户分别对应的数据集合中,获取与所述第一用户的数据集合距离最小的预设数目个目标第二用户的数据集合;
基于所述预设数目个目标第二用户分别对应的表征是否为所述支付卡已流失客户的第一信息,确定所述第一用户对应的第一用户流失概率;
基于至少一个突发事件分别对应的预设概率以及所述第一用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第二用户流失概率;
将所述第一用户流失概率以及所述第二用户流失概率的和,确定为第一目标用户流失概率;
基于所述M个数据所属字段分别对应的预设回归系数以及M个数据,计算得到所述第一用户对应的第三用户流失概率,一个字段对应的预设回归系数表征所述字段影响用户成为流失客户的程度;
基于至少一个所述突发事件分别对应的预设概率以及所述第三用户流失概率,确定所述第一用户因所述至少一个突发事件成为流失客户的第四用户流失概率;
将所述第三用户流失概率以及所述第四用户流失概率的和,确定为第二目标用户流失概率;
基于所述第一目标用户流失概率以及所述第二目标用户流失概率,确定所述第一用户的最终用户流失概率。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至4任一项所述的数据处理方法中的各个步骤。
CN202011046746.8A 2020-09-29 2020-09-29 数据处理方法、装置、电子设备及介质 Active CN112116405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011046746.8A CN112116405B (zh) 2020-09-29 2020-09-29 数据处理方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011046746.8A CN112116405B (zh) 2020-09-29 2020-09-29 数据处理方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN112116405A CN112116405A (zh) 2020-12-22
CN112116405B true CN112116405B (zh) 2024-02-02

Family

ID=73798620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011046746.8A Active CN112116405B (zh) 2020-09-29 2020-09-29 数据处理方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN112116405B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450153A (zh) * 2021-07-02 2021-09-28 京东科技控股股份有限公司 数据处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203822A (zh) * 2016-03-16 2017-09-26 上海吉贝克信息技术有限公司 基于Logistic回归的证券客户流失预测的方法及系统
CN108182633A (zh) * 2018-01-30 2018-06-19 平安普惠企业管理有限公司 贷款数据处理方法、装置、计算机设备和存储介质
CN109461023A (zh) * 2018-10-12 2019-03-12 中国平安人寿保险股份有限公司 流失用户挽回方法及装置、电子设备、存储介质
CN109636446A (zh) * 2018-11-16 2019-04-16 北京奇虎科技有限公司 用户流失预测方法、装置及电子设备
CN111260382A (zh) * 2018-11-30 2020-06-09 北京嘀嘀无限科技发展有限公司 一种流失概率的预测处理方法及装置
CN111651646A (zh) * 2020-06-30 2020-09-11 支付宝(杭州)信息技术有限公司 业务处理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203822A (zh) * 2016-03-16 2017-09-26 上海吉贝克信息技术有限公司 基于Logistic回归的证券客户流失预测的方法及系统
CN108182633A (zh) * 2018-01-30 2018-06-19 平安普惠企业管理有限公司 贷款数据处理方法、装置、计算机设备和存储介质
CN109461023A (zh) * 2018-10-12 2019-03-12 中国平安人寿保险股份有限公司 流失用户挽回方法及装置、电子设备、存储介质
CN109636446A (zh) * 2018-11-16 2019-04-16 北京奇虎科技有限公司 用户流失预测方法、装置及电子设备
CN111260382A (zh) * 2018-11-30 2020-06-09 北京嘀嘀无限科技发展有限公司 一种流失概率的预测处理方法及装置
CN111651646A (zh) * 2020-06-30 2020-09-11 支付宝(杭州)信息技术有限公司 业务处理方法及装置

Also Published As

Publication number Publication date
CN112116405A (zh) 2020-12-22

Similar Documents

Publication Publication Date Title
US10614073B2 (en) System and method for using data incident based modeling and prediction
CN110210900B (zh) 基于交易关联性的参考产品确定方法、装置和设备
US20230013086A1 (en) Systems and Methods for Using Machine Learning Models to Automatically Identify and Compensate for Recurring Charges
CN112116245A (zh) 信贷风险评估方法、装置、计算机设备及存储介质
US20230004979A1 (en) Abnormal behavior detection method and apparatus, electronic device, and computer-readable storage medium
CN109190925B (zh) 保单推荐方法、装置、计算机设备及存储介质
CN112686631A (zh) 任务事项处理方法、装置、计算机设备及存储介质
CN112116405B (zh) 数据处理方法、装置、电子设备及介质
CN111626898B (zh) 用于实现事件归因的方法、装置、介质和电子设备
CN110990007A (zh) 银行软件功能界面生成方法和装置
US20230230126A1 (en) Methods and systems for training and using predictive risk models in software applications
US20220027916A1 (en) Self Learning Machine Learning Pipeline for Enabling Binary Decision Making
CN114298825A (zh) 还款积极度评估方法及装置
CN113962603A (zh) 风险评估方法及装置、存储介质及电子设备
CN112035749A (zh) 用户行为特征分析方法、推荐方法及相应装置
US11270230B1 (en) Self learning machine learning transaction scores adjustment via normalization thereof
US11694208B2 (en) Self learning machine learning transaction scores adjustment via normalization thereof accounting for underlying transaction score bases relating to an occurrence of fraud in a transaction
EP4310755A1 (en) Self learning machine learning transaction scores adjustment via normalization thereof
Liu et al. A reputation revision mechanism to mitigate the negative effects of misreported ratings
CN111738834B (zh) 一种数据处理方法和装置
CN117391330A (zh) 金融业务办理顺序确定方法、装置和计算机设备
US11556945B1 (en) Scalable product influence prediction using feature smoothing
WO2023229474A1 (en) Methods, systems and computer program products for determining models for predicting reoccurring transactions
CN112070593A (zh) 数据处理方法、装置、设备以及存储介质
CN117726431A (zh) 信用信息更新方法、装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant