CN111275261A - 资源流动预测方法以及装置 - Google Patents
资源流动预测方法以及装置 Download PDFInfo
- Publication number
- CN111275261A CN111275261A CN202010065201.5A CN202010065201A CN111275261A CN 111275261 A CN111275261 A CN 111275261A CN 202010065201 A CN202010065201 A CN 202010065201A CN 111275261 A CN111275261 A CN 111275261A
- Authority
- CN
- China
- Prior art keywords
- resource
- user
- data
- flow
- resource flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000011156 evaluation Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 25
- 238000005259 measurement Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000003203 everyday effect Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000003064 k means clustering Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供资源流动预测方法以及装置,其中所述资源流动预测方法包括:获取用户的历史资源流动数据;根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;按照所述用户聚类标签对所述历史资源流动数据进行分类;根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
Description
技术领域
本说明书实施例涉及数据处理技术领域,特别涉及一种资源流动预测方法。本说明书一个或者多个实施例同时涉及一种资源流动预测装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着互联网的发展,各项业务在线上的用户量不断增加,针对各项业务中资源管理的要求也逐步提升,比如,对于资源管理中资源流动性的管理,需要提前估算需要提供给用户的资源值,如果资源池的资源值太低,无法满足用户申请的资源,则会产生流动性风险,但资源池的资源值太高,则会造成资源闲置,提高资源成本,影响业务收益,目前针对资源值的预测方案多是基于业务特征通过时序模型进行预测,但是由于业务特征有限,导致模型精确性有限,因此需要提供更精确可靠的方案。
发明内容
有鉴于此,本说明书实施例提供了一种资源流动预测方法。本说明书一个或者多个实施例同时涉及一种资源流动预测装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种资源流动预测方法,包括:
获取用户的历史资源流动数据;
根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
按照所述用户聚类标签对所述历史资源流动数据进行分类;
根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
可选的,所述根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率,包括:
在所述历史资源流动数据中抽取所述流动时间数据以及所述流动频率数据作为特征数据;
将所述特征数据输入概率预测模型进行资源流动概率预测,获得所述概率预测模型输出的所述用户在第一目标周期内各时间段的所述资源流动概率。
可选的,所述基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签,包括:
根据所述资源流动概率生成流动向量;
将所述流动向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签。
可选的,所述将所述流动向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签子步骤执行之后,还包括:
在所述聚类处理获得的各种聚类用户中筛选出资源流动概率为空的聚类用户作为目标聚类用户;
将所述目标聚类用户中在资源数据库存在历史流动时间数据或历史流动值数据的用户作为低活跃用户进行聚类,生成低活跃用户标签,根据所述低活跃用户标签更新所述用户聚类标签;
将所述目标聚类用户中不存在所述历史流动时间数据或所述历史流动值数据的用户作为新用户进行聚类,生成新用户标签,根据所述新用户标签更新所述用户聚类标签。
可选的,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值,包括:
将分类后的历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源流动预测模型输出的所述用户在第二目标周期内各时间段的资源流动值。
可选的,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值,包括:
分别将分类后的各类历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源测模型输出的所述各个用户聚类标签对应的聚类用户在所述第二目标周期内各时间段的分类资源流动值;
将各种聚类用户的对应的分类资源流动值按照所述第二目标周期内各时间段进行汇总,获得所述用户在所述第二目标周期内各时间段的所述资源流动值。
可选的,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值步骤执行之后,还包括:
根据所述用户在第二目标周期内各时间段的实际资源流动值对所述资源流动值进行预测评估,获得所述预测评估的评估结果。
可选的,所述概率预测模型,通过如下方式进行训练:
获取所述用户的历史流动时间数据以及历史流动频率数据;
根据所述历史流动时间数据以及所述历史流动频率数据建立训练集;
采用梯度提升回归树算法建立初始概率预测模型;
根据所述训练集中的训练样本对所述初始概率预测模型进行训练,训练完成后获得所述概率预测模型。
可选的,所述获取用户的历史资源流动数据,包括:
获取用户在各个资源维度的维度资源流动数据;
针对所述维度资源流动数据进行数据预处理;
按照所述用户的标识信息将预处理后的维度资源流动数据进行关联,获得所述用户的所述历史资源流动数据。
可选的,所述历史资源流动数据,包括下述至少一项:所述流动时间数据、流动概率数据、流动值数据、资源值数据、资源维度。
根据本说明书实施例的第二方面,提供了一种资源流动预测装置,包括:
获取模块,被配置为获取用户的历史资源流动数据;
概率预测模块,被配置为根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
聚类模块,被配置为基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
分类模块,被配置为按照所述用户聚类标签对所述历史资源流动数据进行分类;
值预测模块,被配置为根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取用户的历史资源流动数据;
根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
按照所述用户聚类标签对所述历史资源流动数据进行分类;
根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述资源流动预测方法的步骤。
本说明书提供一种资源流动预测方法,包括:获取用户的历史资源流动数据;根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;按照所述用户聚类标签对所述历史资源流动数据进行分类;根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
本说明书一个实施例,根据获取的用户的历史资源流动数据预测用户的资源流动概率,以此了解用户的资源流动规律,并根据资源流动概率对用户进行聚类处理,即根据用户的资源流动规律对用户进行聚类处理,获得针对不同聚类用户的用户聚类标签,并按照用户聚类标签对历史资源流动数据进行分类,根据分类后的历史资源流动数据进行资源流动预测,获得用户在第二目标周期内各时间段的资源流动值,实现了通过不同聚类用户的资源流动规律预测其未来一段时间内的资源流动值,提高了资源流动预测的精确性。
附图说明
图1是本说明书一个实施例提供的一种资源流动预测方法的流程图;
图2是本说明书一个实施例提供的一种应用于借贷场景的资源流动预测方法的处理流程图;
图3是本说明书一个实施例提供的一种资源流动预测装置的结构示意图;
图4是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本说明书中,提供了一种资源流动预测方法,本说明书一个或者多个实施例同时涉及一种资源流动预测装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
本说明书提供的一种资源流动预测方法实施例如下:
图1示出了根据本说明书一个实施例提供的一种资源流动预测方法的流程图,包括步骤S102至步骤S110。
步骤S102,获取用户的历史资源流动数据。
实际应用中,在很多业务里常常涉及到大量用户申请资源或供给资源的情况,这些用户申请资源或供给资源的时间,并非完全是周期性的,而是具有一定的随机性,因此需要提前预测提供给用户的资源值或可接收的资源值,以至于不会因为资源不足而出现流动性风险,也不会因为资源太多而出现资源闲置的情况,本说明书实施例,根据用户的历史资源流动数据对用户进行聚类,并通过不同聚类用户的资源流动规律预测未来一段时间内的资源流动值,提高了资源流动预测的精确性。
具体的,所述资源可以是产品、资金、物资等,在此不做限制;所述历史资源流动数据,是指可申请资源的用户在过去一段时间之内的资源流入数据或资源流出数据,可选的,所述历史资源流动数据,包括下述至少一项:流动时间数据、流动概率数据、流动值数据、资源值数据、资源维度。
其中,所述流动时间数据,是指用户的资源流入/流出时间,比如用户A的资源流出时间为2019年2月15日,表明用户M在2019年2月15日申请了一笔资源;所述流动概率数据,是指用户在一段时间内资源流入/流出的概率;所述流动值数据,是指用户历史申请/供给资源的数值;所述资源值数据,是指用户可申请/可供给的最高的资源值;所述资源维度,是指用户的资源流入数据/资源流出数据的所属维度,比如用户A在资源平台P1具有资源流动数据,在资源平台P2也具有资源流动数据,其中,资源平台P1和资源平台P2称为用户A资源流动的资源维度。
具体实施时,获取用户的历史资源流动数据,可以是在资源数据库中获取用户在过去三个月内流动时间数据、流动概率数据、流动值数据、资源值数据、资源维度等历史资源流动数据。
实际应用中,一个公司可能具有多个不同的可进行资源申请的资源平台,用户可能在不同的资源平台都会进行资源申请,因此该业务公司需要提供给用户的资源不是一个资源平台的流动资源,而是多个资源平台流动资源的总和,那么在进行资源流动预测之前,需要将每个用户在各个资源平台的资源流动数据进行关联,以便对用户未来一段时间的资源流动值做出更精确的预测,本说明书实施例提供的一种可选实施方式中,所述获取用户的历史资源流动数据,包括:
获取用户在各个资源维度的维度资源流动数据;
针对所述维度资源流动数据进行数据预处理;
按照所述用户的标识信息将预处理后的维度资源流动数据进行关联,获得所述用户的所述历史资源流动数据。
其中,所述标识信息可以是唯一标识用户的信息,比如身份证号码,社保卡编号,手机号码等信息;所述维度资源流动数据,是指某一资源维度的资源流动数据,比如资源平台P1的资源流动数据;所述将预处理后的维度资源流动数据进行关联,是指将不同资源维度的具有相同标识信息的用户的维度资源流动数据关联起来。
实际应用中,在获取用户在各个资源维度的维度之后,还需要对获得的维度资源数据进行数据预处理,比如将维度资源流动数据按照特定字段顺序进行数据预处理,或按照特定字段格式进行数据预处理,此外,上述数据预处理过程也可以在获得用户的历史资源流动数据之后执行,在此不做限制。
例如,公司M具有两个不同的用于申请资源的资源平台,分别为资源平台P1和资源平台P2,且在公司M的这两个资源平台上总计有用户10000人,分别获取这10000人在资源平台P1上过去三个月内的维度资源流出数据D1以及资源平台P2在过去三个月内的维度资源流出数据D2,在这10000人中这三个月内具有维度资源数据的用户有3000人,其他7000人在这三个月内并无维度资源数据,将这3000人的维度资源流出数据D1以及维度资源流出数据D2按照特定字段顺序以及字段格式进行数据预处理,将预处理后的维度资源流出数据D1和维度资源流出数据D2中具有相同身份证号码的用户的流出时间数据、流出概率数据、流出值数据、资源值数据、资源维度等进行关联,作为这3000个用户在过去三个月内的历史资源流出数据。
步骤S104,根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率。
具体的,在上述步骤S102中获取到用户的历史资源流动数据的基础上,根据历史资源流动数据中的流动时间数据以及流动频率数据,预测用户在第一目标周期各时间段的资源流动概率。其中,第一目标周期,可以是一个月,还可以是一周、两周等时间段,在此不做限制;相应的,第一目标周期中各时间段可以是这个月中每一天、或者一周中的每12个小时,在此不做限制;所述资源流动概率可以是从0-1之间的数值,数值越大表示资源流动概率越大;在此,预测用户在第一目标周期各时间段的资源流动概率可以是预测用户在一个月内每一天的资源流动概率。
除根据流动时间数据以及流动频率数据预测用户的资源流动概率之外,还可以根据流动值数据、资源值数据等其他数据一起作为依据进行预测,在此不做限制。
实际应用中,在预测资源流动概率的过程中,流动时间数据以及流动频率数据计算量比较大,计算复杂,尤其是在流动时间数据以及流动频率数据比较多或者预测场景较为复杂的情况下,预测资源流动概率所需的计算量更大、处理时间也更长,为提升处理效率,通过引入机器学习方法来提升预测资源流动概率的处理效率,在上述获取用户的历史资源流动数据的基础上,本说明书实施例提供的一种可选实施方式中,预测所述用户在第一目标周期内各时间段的资源流动概率,具体采用如下方式实现:
在所述历史资源流动数据中抽取所述流动时间数据以及所述流动频率数据作为特征数据;
将所述特征数据输入概率预测模型进行资源流动概率预测,获得所述概率预测模型输出的所述用户在第一目标周期内各时间段的所述资源流动概率。
具体实施时,此概率预测模型可以采用32分类预测模型,具体的,此32分类预测模型中将其中31分类分别对应每个月的31天,第32分类代表用户在该月无资源流动,利用梯度提升树,预测用户在未来一个月内每一天的资源流动概率。
沿用上例,在上述3000个用户在过去三个月内有关资源的流出时间数据、流出概率数据、流出值数据、资源值数据、资源维度等数据中,提取每个用户的流出时间数据以及流出频率数据作为特征数据,将这些特征数据输入概率预测模型,获得概率预测模型输出的每个用户在未来一个月内每天有资源流出的概率以及这个月无资源流出的概率,具体的,获得用户A在一个月内每天有资源流出的概率以及这个月无资源流出的概率分别为:R1,R2,R3,R4,R5,R6,R7,R8,R9,R10,R11,R12,R13,R14,R15,R16,R17,R18,R19,R20,R21,R22,R23,R24,R25,R26,R27,R28,R29,R30,R31,R32。
进一步的,为了提高概率预测模型预测的准确性,需要通过大量的样本数据执行对上述概率预测模型的训练,本说明书实施例提供的一种可选实施方式中,所述概率预测模型,通过如下方式进行训练:
获取所述用户的历史流动时间数据以及历史流动频率数据;
根据所述历史流动时间数据以及所述历史流动频率数据建立训练集;
采用梯度提升回归树算法建立初始概率预测模型;
根据所述训练集中的训练样本对所述初始概率预测模型进行训练,训练完成后获得所述概率预测模型。
具体的,所述历史流动时间数据以及历史流动频率数据与上述流动时间数据以及流动频率数据类似,此历史流动时间是指在资源数据库中历史一段时间内的流动时间数据,历史流动频率是指在资源数据库中历史一段时间内的流动频率数据,比如将获取的一年内或两年内的流动时间数据称为历史流动时间。
例如:获取公司M的资源平台P1以及资源平台P2上10000个用户过去一年内的历史流出时间数据以及历史流出频率数据,将这些数据建立训练集,采用梯度提升树回归算法建立初始概率预测模型,并通过上述训练集中历史流出时间数据以及历史流出频率数据对初始概率预测模型进行训练,训练完成后获得概率预测模型。
步骤S106,基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签。
实际应用中,基于资源流动概率对用户进行聚类处理,是将预测的未来一个月用户的流动时间相似的用户聚成一类;具体的,聚类处理获得的用户聚类标签,可以是第一用户标签,第二用户标签等。
具体实施时,在聚类处理的过程中,资源流动概率比较多的情况下,并不容易发现用户聚类的规律,且对用户进行聚类处理所需的计算量大、处理时间也长,为提升处理效率,通过引入机器学习方法来提升聚类处理的处理效率以及准确性,本说明书实施例提供的一种可选实施方式中,所述基于所述资源流动概率对所述用户进行聚类处理,具体采用如下方式实现:
根据所述资源流动概率生成流动向量;
将所述流动向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签。
具体的,根据资源流动概率生成流动向量,是将针对每个用户生成的资源流动概率向量化;用户聚类模型,可以采用k均值聚类算法构建的聚类模型。
实际应用中,由于所有用户中只有一部分用户在获取的历史资源流动数据中存在相应的数据,因此也只针对这一部分用户预测出了资源流动概率,针对除这一部分用户之外的其他用户并不具有相应的资源流动概率,在这种情况下,可以针对不具有资源流动概率的用户抽象出流动向量(即按照资源流动概率都为0抽象出流动向量),进而再对所有用户进行聚类处理。
此外,还可以在针对这一部分预测出了资源流动概率的用户采用用户聚类模型进行聚类处理之后,将其他用户全部归为另外一类,或者根据在资源数据库中是否存在资源流动数据,将其他用户归为新用户或低活跃用户两类,在此不做限制。
沿用上例,将3000个存在资源流出概率的用户,每个用户的资源流出概率进行向量化生成针对每个用户的流出向量,其中用户A的资源流出概率为:R1,R2,R3,R4,R5,R6,R7,R8,R9,R10,R11,R12,R13,R14,R15,R16,R17,R18,R19,R20,R21,R22,R23,R24,R25,R26,R27,R28,R29,R30,R31,R32,根据此资源流出概率生成用户A的流出向量为:{R1,R2,R3,R4,R5,R6,R7,R8,R9,R10,R11,R12,R13,R14,R15,R16,R17,R18,R19,R20,R21,R22,R23,R24,R25,R26,R27,R28,R29,R30,R31,R32},针对另外7000个不存在资源流出概率的用户生成流出向量为:{0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1};
则将生成的流出向量输入k均值聚类模型对全部10000个用户进行聚类,k均值聚类模型将上述3000个存在资源流出概率的用户分为九类聚类用户,每一类用户对应一种用户聚类标签,这些用户聚类标签分别是:第一用户标签、第二用户标签、第三用户标签、第四用户标签、第五用户标签、第六用户标签、第七用户标签、第八用户标签、第九用户标签,另外7000个用户则作为第十类聚类用户,对应的用户聚类标签为第十用户标签。
实际应用中,在上述采用用户聚类模型进行聚类处理之外,针对这些用户中不存在资源流动概率的用户,即出流动时间数据或流动值数据为空的目标用户,还可以进一步进行聚类,以此细化对用户的分类,减少了针对不同用户共同进行资源流动预测的干扰,增加了进行资源流动预测的准确性,本说明书实施例提供的一种可选实施方式中,所述将所述流动向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签子步骤执行之后,还包括:
在所述聚类处理获得的各种聚类用户中筛选出资源流动概率为空的聚类用户作为目标聚类用户;
将所述目标聚类用户中在资源数据库存在历史流动时间数据或历史流动值数据的用户作为低活跃用户进行聚类,生成低活跃用户标签,根据所述低活跃用户标签更新所述用户聚类标签;
将所述目标聚类用户中不存在所述历史流动时间数据或所述历史流动值数据的用户作为新用户进行聚类,生成新用户标签,根据所述新用户标签更新所述用户聚类标签。
实际应用中,针对在一段时间内资源流动概率为空的用户,即在一段时间内没有资源流动的用户,做进一步细化聚类,这一类用户可能存在两种情况,一种是很久以前注册的用户,但这段时间之内没有资源流动,即资源流动概率为空,但在资源数据库中存在历史流动时间数据或历史流动值数据的用户,则此用户是低活跃用户;一种是在资源平台新注册的用户,即资源流动概率为空,且在资源数据库中不存在历史流动时间数据或历史流动值数据的用户,则此用户很可能是新注册的用户。
具体实施时,除在所述聚类处理获得的各种聚类用户中,筛选出资源流动概率为空的聚类用户作为目标聚类用户,还可以根据所述历史资源流动数据,在用户中筛选出流动时间数据或流动值数据为空的用户作为目标聚类用户。
沿用上例,将上述第十类聚类用户的7000个用户中,筛选出资源流出概率为空的第十类聚类用户作为目标聚类用户,在这7000个用户中,将资源数据库中存在历史流出时间数据或历史流出值数据的用户作为低活跃用户进行聚类,生成低活跃用户标签的方式更新用户聚类标签,且通过将这类低活跃用户的用户聚类标签从第十用户标签更新为低活跃用户标签;并在这7000个用户中,将在资源数据库中不存在历史流出时间数据或历史流出值数据的用户作为新用户进行聚类,生成新用户标签,且通过将这类新用户的用户聚类标签从第十用户标签更新为新用户标签的方式更新用户聚类标签。
步骤S108,按照所述用户聚类标签对所述历史资源流动数据进行分类。
具体的,在上述步骤S106中获得用户聚类标签的基础上,根据这些用户聚类标签对历史资源流动数据进行分类,可以是用这些用户聚类标签对历史资源流动数据打标的方式进行分类,比如,获取这些历史资源流动数据其所属的用户对应的用户聚类标签,并将对应的用户聚类标签在这些历史资源流动数据对应的标签字段添加相应的用户聚类标签。
沿用上例,将上述获得的用户聚类标签:第一用户标签、第二用户标签、第三用户标签、第四用户标签、第五用户标签、第六用户标签、第七用户标签、第八用户标签、第九用户标签、低活跃用户标签以及新用户标签,对各类用户聚类标签对应的聚类用户的历史资源流出数据进行打标,即将各类聚类用户的历史资源流出数据也按照聚类用户的类别分为了十一类。
步骤S110,根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
其中,第二目标周期,可以是15天、一个月或者45天,相应的,第二目标周期中各时间段可以是将15天中的每一天作为一个时间段,也可以是将一个月中每12个小时作为一个时间段,具体的,第二目标周期的长短和时间段的长短都可以按照实际业务需要进行调整,在此不做限制。
实际应用中,根据分类后的历史资源流动数据进行资源流动预测,可以是根据分类后的历史资源流动数据分别进行资源流动预测,也可以是将分类后的历史资源流动数据合在一起进行资源流动预测,在此不做限制。
具体实施时,可以将分类后的历史资源流动数据合在一起进行资源流动预测,基于历史资源流动数据的完整性,提高了资源流动预测的准确性,且在资源流动预测的过程中,针对分类后的历史资源流动数据计算量比较大,计算复杂,尤其是历史资源流动数据比较多或者预测场景较为复杂的情况下,资源流动预测所需的计算量更大,处理实际也更长,为了提升处理效率,通过引入机器学习方法来提升资源流动预测的处理效率,本说明书实施例提供的一种可选实施方式中,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值,包括:
将分类后的历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源流动预测模型输出的所述用户在第二目标周期内各时间段的资源流动值。
沿用上例,将10000个用户对应的分类后的十一类历史资源流出数据共同输入资源测模型进行资源流出预测,获得资源测模型输出的10000个用户在未来7天内每天的资源流出值分别为:5000万、6000万、9000万、4500万、8700万、3500万、6800万。
此外,还可以将分类后的历史资源流动数据按照类别分别进行资源流动预测,预测出各个聚类用户在第二目标周期内各时间段的分类资源流动值,减少了每次资源流动预测的数据量,提升了运算效率,通过引入机器学习方法来提升资源流动预测的处理效率,进一步提升了运算效率,本说明书实施例提供的一种可选实施方式中,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值,包括:
分别将分类后的各类历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源测模型输出的所述各个用户聚类标签对应的聚类用户在所述第二目标周期内各时间段的分类资源流动值;
将各种聚类用户的对应的分类资源流动值按照所述第二目标周期内各时间段进行汇总,获得所述用户在所述第二目标周期内各时间段的所述资源流动值。
沿用上例,分类后的第一用户标签对应的历史资源流出数据单独输入资源测模型进行资源流出预测,获得资源测模型输出的第一用户标签对应的500个聚类用户在未来7天内每天的资源流出值分别为:300万、500万、600万、120万、360万、780万、560万;
类似的,分别将分类后第二用户标签、第三用户标签……新用户标签对应的历史资源流出数据单独输入资源测模型进行资源流出预测,获得资源测模型输出的针对第二用户标签、第三用户标签……新用户标签对应的聚类用户在未来7天每天的资源流出值;
将第一用户标签、第二用户标签、第三用户标签……新用户标签对应的聚类用户在未来7天第一天的资源流出值相加,相加之和作为用户在未来7天第一天的资源流出值,类似的,分别将第一用户标签、第二用户标签、第三用户标签……新用户标签对应的聚类用户在未来7天第二天、第三天……第七天的资源流出值相加,相加之和作为用户在未来7天第二天、第三天……第七天的资源流出值。
进一步的,在预测获得用户在第二目标周期内各实际段的资源流动值的基础上,还可以对预测出的资源流动值进行预测评估,以便根据评估结果可以对上述资源流动预测方法进行调优,进一步增加预测资源流动值的准确率,本说明书实施例提供的一种可选实施方式中,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值步骤执行之后,还包括:
根据所述用户在第二目标周期内各时间段的实际资源流动值对所述资源流动值进行预测评估,获得所述预测评估的评估结果。
具体实施时,根据所述用户在第二目标周期内各时间段的实际资源流动值对所述资源流动值进行预测评估,可以计算第二目标周期各时间段的实际资源流动值与对应的资源流动值的差值结果之和,或计算此差值在各时间段的差值平均,将此差值之和,或差值平均作为预测评估的评估结果,还可以计算第二目标周期各时间段的实际资源流动值与对应的资源流动值的比值之和,或计算此比值在各时间段的比值平均,将此比值之和,或比值平均作为预测评估的评估结果
沿用上例,计算资源测模型输出的10000个用户在未来7天内第一天的资源流出值5000万与这10000个用户在未来7天第一天的实际资源流出值:5050万的差值为-50万,类似的,分别计算资源测模型输出的10000个用户在未来7天中第二天、第三天……第七天的资源流出值与这10000个用户在未来7天中第二天、第三天……第七天的是资源流出值的差值,获得的差值分别为:100万、-60万、35万、10万、80万、-30万、20万;将这些差值求差值平均:(-50万+100万-60万+35万+10万+80万-30万+20万)/7=15万,将这15万作为对资源流出预测的预测结果进行预测评估的评估结果。
实际应用中,在此评估结果超出某一范围的时候,还可以根据此评估结果判断历史资源流动数据、资源流动预测模型等是否存在异常,并针对异常情况进行排查。
下述结合附图2,以本说明书提供的资源流动预测方法在借贷场景中的应用为例,对所述资源流动预测方法进行进一步说明。其中,图2示出了本说明书一个实施例提供的一种应用于借贷场景的资源流动预测方法的处理流程图,具体步骤包括步骤S202至步骤S222。
步骤S202,获取用户在各个贷款平台的维度贷款流出数据。
具体的,所述维度贷款流出数据是指维度放款数据。
步骤S204,针对所述维度贷款流出数据进行数据预处理。
步骤S206,按照所述用户的标识信息将预处理后的维度贷款流出数据进行关联,获得所述用户的所述历史贷款流出数据。
具体的,所述历史贷款流出数据是指历史放款数据。
步骤S208,在所述历史贷款流出数据中抽取所述流出时间数据以及所述流出频率数据作为特征数据。
步骤S210,将所述特征数据输入概率预测模型进行贷款流出概率预测,获得所述概率预测模型输出的所述用户在第一目标周期内各时间段的贷款流出概率。
步骤S212,根据所述贷款流出概率生成流出向量。
步骤S214,将所述流出向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签。
步骤S216,按照所述用户聚类标签对所述历史贷款流出数据进行分类。
步骤S218,分别将分类后的各类历史贷款流出数据输入资源测模型进行资源流出预测,获得所述资源测模型输出的所述各个用户聚类标签对应的聚类用户在所述第二目标周期内各时间段的分类贷款流出额度。
步骤S220,将各种聚类用户的对应的分类贷款流出值按照所述第二目标周期内各时间段进行汇总,获得所述用户在所述第二目标周期内各时间段的所述贷款流出额度。
步骤S222,根据所述用户在第二目标周期内各时间段的实际贷款流出额度对所述贷款流出额度进行预测评估,获得所述预测评估的评估结果。
综上所述,本说明书一个实施例,根据获取的用户的历史贷款流出数据预测用户的贷款流出概率,以此了解用户的贷款流出规律,并根据贷款流出概率对用户进行聚类处理,即根据用户的贷款流出规律对用户进行聚类处理,获得针对不同聚类用户的用户聚类标签,并按照用户聚类标签对历史贷款流出数据进行分类,根据分类后的历史贷款流出数据进行资源流出预测,获得用户在第二目标周期内各时间段的贷款流出额度,实现了通过不同聚类用户的贷款流出规律预测其未来一段时间内的贷款流出额度,提高了流出贷款预测的精确性。
本说明书提供的一种资源流动预测装置实施例如下:
与上述方法实施例相对应,本说明书还提供了资源流动预测装置实施例,图3示出了本说明书一个实施例提供的一种资源流动预测装置的结构示意图。
如图3所示,该装置包括:
获取模块302,被配置为获取用户的历史资源流动数据;
概率预测模块304,被配置为根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
聚类模块306,被配置为基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
分类模块308,被配置为按照所述用户聚类标签对所述历史资源流动数据进行分类;
值预测模块310,被配置为根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
可选的,所述概率预测模块304,包括:
抽取子模块,被配置为在所述历史资源流动数据中抽取所述流动时间数据以及所述流动频率数据作为特征数据;
概率预测子模块,被配置为将所述特征数据输入概率预测模型进行资源流动概率预测,获得所述概率预测模型输出的所述用户在第一目标周期内各时间段的所述资源流动概率。
可选的,所述聚类模块306,包括:
生成子模块,被配置为根据所述资源流动概率生成流动向量;
用户聚类子模块,被配置为将所述流动向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签。
可选的,所述聚类模块306,还包括:
筛选子模块,被配置为在所述聚类处理获得的各种聚类用户中筛选出资源流动概率为空的聚类用户作为目标聚类用户;
低活跃聚类子模块,被配置为将所述目标聚类用户中在资源数据库存在历史流动时间数据或历史流动值数据的用户作为低活跃用户进行聚类,生成低活跃用户标签,根据所述低活跃用户标签更新所述用户聚类标签;
新用户聚类子模块,被配置为将所述目标聚类用户中不存在所述历史流动时间数据或所述历史流动值数据的用户作为新用户进行聚类,生成新用户标签,根据所述新用户标签更新所述用户聚类标签。
可选的,所述值预测模块310,包括:
第一资源流动预测子模块,被配置为将分类后的历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源流动预测模型输出的所述用户在第二目标周期内各时间段的资源流动值。
可选的,所述值预测模块310,包括:
第二资源流动预测子模块,被配置为分别将分类后的各类历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源测模型输出的所述各个用户聚类标签对应的聚类用户在所述第二目标周期内各时间段的分类资源流动值;
汇总子模块,被配置为将各种聚类用户的对应的分类资源流动值按照所述第二目标周期内各时间段进行汇总,获得所述用户在所述第二目标周期内各时间段的所述资源流动值。
可选的,所述资源流动预测装置,还包括:
评估模块,被配置为根据所述用户在第二目标周期内各时间段的实际资源流动值对所述资源流动值进行预测评估,获得所述预测评估的评估结果。
可选的,所述概率预测模型,通过如下方式进行训练:
获取所述用户的历史流动时间数据以及历史流动频率数据;
根据所述历史流动时间数据以及所述历史流动频率数据建立训练集;
采用梯度提升回归树算法建立初始概率预测模型;
根据所述训练集中的训练样本对所述初始概率预测模型进行训练,训练完成后获得所述概率预测模型。
可选的,所述获取模块302,包括:
获取数据子模块,被配置为获取用户在各个资源维度的维度资源流动数据;
预处理子模块,被配置为针对所述维度资源流动数据进行数据预处理;
关联子模块,被配置为按照所述用户的标识信息将预处理后的维度资源流动数据进行关联,获得所述用户的所述历史资源流动数据。
可选的,所述历史资源流动数据,包括下述至少一项:所述流动时间数据、流动概率数据、流动值数据、资源值数据、资源维度。
上述为本实施例的一种资源流动预测装置的示意性方案。需要说明的是,该资源流动预测装置的技术方案与上述的资源流动预测方法的技术方案属于同一构思,资源流动预测装置的技术方案未详细描述的细节内容,均可以参见上述资源流动预测方法的技术方案的描述。
本说明书提供的一种计算设备实施例如下:
图4示出了根据本说明书一个实施例提供的一种计算设备400的结构框图。该计算设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。
计算设备400还包括接入设备440,接入设备440使得计算设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备400的上述部件以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备400可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备400还可以是移动式或静止式的服务器。
本说明书提供一种计算设备,包括存储器410、处理器420及存储在存储器上并可在处理器上运行的计算机指令,所述处理器420用于执行如下计算机可执行指令:
获取用户的历史资源流动数据;
根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
按照所述用户聚类标签对所述历史资源流动数据进行分类;
根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的资源流动预测方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述资源流动预测方法的技术方案的描述。
本说明书提供的一种计算机可读存储介质实施例如下:
本说明书提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
获取用户的历史资源流动数据;
根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
按照所述用户聚类标签对所述历史资源流动数据进行分类;
根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的资源流动预测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述资源流动预测方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (13)
1.一种资源流动预测方法,包括:
获取用户的历史资源流动数据;
根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
按照所述用户聚类标签对所述历史资源流动数据进行分类;
根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
2.根据权利要求1所述的资源流动预测方法,所述根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率,包括:
在所述历史资源流动数据中抽取所述流动时间数据以及所述流动频率数据作为特征数据;
将所述特征数据输入概率预测模型进行资源流动概率预测,获得所述概率预测模型输出的所述用户在第一目标周期内各时间段的所述资源流动概率。
3.根据权利要求2所述的资源流动预测方法,所述基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签,包括:
根据所述资源流动概率生成流动向量;
将所述流动向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签。
4.根据权利要求3所述的资源流动预测方法,所述将所述流动向量输入用户聚类模型对所述用户进行聚类,获得所述用户聚类模型输出的针对所述用户的用户聚类标签子步骤执行之后,还包括:
在所述聚类处理获得的各种聚类用户中筛选出资源流动概率为空的聚类用户作为目标聚类用户;
将所述目标聚类用户中在资源数据库存在历史流动时间数据或历史流动值数据的用户作为低活跃用户进行聚类,生成低活跃用户标签,根据所述低活跃用户标签更新所述用户聚类标签;
将所述目标聚类用户中不存在所述历史流动时间数据或所述历史流动值数据的用户作为新用户进行聚类,生成新用户标签,根据所述新用户标签更新所述用户聚类标签。
5.根据权利要求1所述的资源流动预测方法,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值,包括:
将分类后的历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源流动预测模型输出的所述用户在第二目标周期内各时间段的资源流动值。
6.根据权利要求1所述的资源流动预测方法,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值,包括:
分别将分类后的各类历史资源流动数据输入资源测模型进行资源流动预测,获得所述资源测模型输出的所述各个用户聚类标签对应的聚类用户在所述第二目标周期内各时间段的分类资源流动值;
将各种聚类用户的对应的分类资源流动值按照所述第二目标周期内各时间段进行汇总,获得所述用户在所述第二目标周期内各时间段的所述资源流动值。
7.根据权利要求1所述的资源流动预测方法,所述根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值步骤执行之后,还包括:
根据所述用户在第二目标周期内各时间段的实际资源流动值对所述资源流动值进行预测评估,获得所述预测评估的评估结果。
8.根据权利要求2所述的资源流动预测方法,所述概率预测模型,通过如下方式进行训练:
获取所述用户的历史流动时间数据以及历史流动频率数据;
根据所述历史流动时间数据以及所述历史流动频率数据建立训练集;
采用梯度提升回归树算法建立初始概率预测模型;
根据所述训练集中的训练样本对所述初始概率预测模型进行训练,训练完成后获得所述概率预测模型。
9.根据权利要求1所述的资源流动预测方法,所述获取用户的历史资源流动数据,包括:
获取用户在各个资源维度的维度资源流动数据;
针对所述维度资源流动数据进行数据预处理;
按照所述用户的标识信息将预处理后的维度资源流动数据进行关联,获得所述用户的所述历史资源流动数据。
10.根据权利要求1所述的资源流动预测方法,所述历史资源流动数据,包括下述至少一项:所述流动时间数据、流动概率数据、流动值数据、资源值数据、资源维度。
11.一种资源流动预测装置,包括:
获取模块,被配置为获取用户的历史资源流动数据;
概率预测模块,被配置为根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
聚类模块,被配置为基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
分类模块,被配置为按照所述用户聚类标签对所述历史资源流动数据进行分类;
值预测模块,被配置为根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
12.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取用户的历史资源流动数据;
根据所述历史资源流动数据中的流动时间数据以及流动频率数据,预测所述用户在第一目标周期内各时间段的资源流动概率;
基于所述资源流动概率对所述用户进行聚类处理,获得针对所述用户的用户聚类标签;
按照所述用户聚类标签对所述历史资源流动数据进行分类;
根据分类后的历史资源流动数据进行资源流动预测,获得所述用户在第二目标周期内各时间段的资源流动值。
13.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至10任意一项所述资源流动预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010065201.5A CN111275261A (zh) | 2020-01-20 | 2020-01-20 | 资源流动预测方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010065201.5A CN111275261A (zh) | 2020-01-20 | 2020-01-20 | 资源流动预测方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111275261A true CN111275261A (zh) | 2020-06-12 |
Family
ID=71002225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010065201.5A Pending CN111275261A (zh) | 2020-01-20 | 2020-01-20 | 资源流动预测方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111275261A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116186417A (zh) * | 2023-04-25 | 2023-05-30 | 北京阿帕科蓝科技有限公司 | 推荐方法、装置、计算机设备和存储介质 |
-
2020
- 2020-01-20 CN CN202010065201.5A patent/CN111275261A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116186417A (zh) * | 2023-04-25 | 2023-05-30 | 北京阿帕科蓝科技有限公司 | 推荐方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI705341B (zh) | 特徵關係推薦方法及裝置、計算設備及儲存媒體 | |
CN111401788B (zh) | 业务时序指标的归因方法以及装置 | |
CN110008977B (zh) | 聚类模型构建方法以及装置 | |
CN111461681B (zh) | 审核方法以及装置 | |
CN110046981B (zh) | 一种信用评估方法、装置及存储介质 | |
CN112015747B (zh) | 数据上传方法及装置 | |
CN115062732B (zh) | 基于大数据用户标签信息的资源共享合作推荐方法及系统 | |
CN110555749B (zh) | 基于神经网络的信用行为预测方法以及装置 | |
CN111275261A (zh) | 资源流动预测方法以及装置 | |
CN112015870A (zh) | 数据上传方法及装置 | |
CN111552846B (zh) | 识别可疑关系的方法以及装置 | |
CN110163761B (zh) | 基于图像处理的可疑项目成员识别方法及装置 | |
CN109598508B (zh) | 一种识别方法和装置、一种计算设备及存储介质 | |
CN109919811B (zh) | 基于大数据的保险代理人培养方案生成方法及相关设备 | |
CN112528662A (zh) | 基于元学习的实体类别识别方法、装置、设备和存储介质 | |
CN111984704A (zh) | 数据筛选方法及装置 | |
CN111090723A (zh) | 一种基于知识图谱的电网安全生产内容推荐方法 | |
CN111626887A (zh) | 一种社交关系评估方法及装置 | |
Abdalla et al. | Classification of customer call details records using Support Vector Machine (SVMs) and Decision Tree (DTs) | |
CN114564637B (zh) | 信息处理方法以及装置 | |
Sujah et al. | Mining profitability of telecommunication customers and customer segmentation with novel data mining approach | |
CN116911420A (zh) | 预测模型的训练、预测方法、装置、电子设备及存储介质 | |
CN118171913A (zh) | 一种基于机器学习的投诉风险审计方法和系统 | |
Aravinda et al. | Customer Churn Prediction in the Telecom Sector with Machine Learning and Adaptive k-Means Cluster using Imbalance Data | |
CN118468940A (zh) | 图联邦学习系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200612 |
|
RJ01 | Rejection of invention patent application after publication |