CN112862546A - 用户流失预测方法、装置、计算机设备及存储介质 - Google Patents

用户流失预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112862546A
CN112862546A CN202110448391.3A CN202110448391A CN112862546A CN 112862546 A CN112862546 A CN 112862546A CN 202110448391 A CN202110448391 A CN 202110448391A CN 112862546 A CN112862546 A CN 112862546A
Authority
CN
China
Prior art keywords
target
fully
risk loss
loss
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110448391.3A
Other languages
English (en)
Other versions
CN112862546B (zh
Inventor
吴志成
张莉
乔延柯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110448391.3A priority Critical patent/CN112862546B/zh
Publication of CN112862546A publication Critical patent/CN112862546A/zh
Application granted granted Critical
Publication of CN112862546B publication Critical patent/CN112862546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种用户流失预测方法、装置、计算机设备及存储介质,包括:将基于用户历史数据构建的每个训练数据集与一个第一全连接网络进行关联,第一全连接网络的数量与用户历史数据的维度相同;使用训练数据集对对应的第一全连接网络进行迭代训练;计算第一全连接网络进行全连接计算的第一目标时间,根据第一目标时间调整第一风险损失层的第一权重得到第一目标权重;根据第一全连接网络输出的第一结果与第一目标权重计算第一风险损失值,并在第一风险损失值达到第一预设阈值时得到流失预测模型;使用流失预测模型基于目标用户的用户数据对目标用户进行流失预测。本发明能够准确的预测用户的流失概率。

Description

用户流失预测方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种用户流失预测方法、装置、计算机设备及存储介质。
背景技术
当某个人以某种方式、形态或形式表明了对某个产品或服务的兴趣时,那么这个人就是销售人员需要跟进的销售线索,对销售线索进行流失预测极为重要。
发明人在实现本发明的过程中发现,现有技术中通过获取用户的不同属性的数据来训练Logistic回归模型,进行流失预警,然而Logistic回归模型的回归系数是利用已有的用户数据采用最大似然估计得到的估计值,该估计值无法调整对流失的影响比重,因而,使用训练完成的Logistic回归模型对目标用户进行流失预测,准确度较低。
发明内容
鉴于以上内容,有必要提出一种用户流失预测方法、装置、计算机设备及存储介质,能够准确的预测用户的流失概率。
本发明的第一方面提供一种用户流失预测方法,所述方法包括:
基于用户历史数据构建多个训练数据集,将所述多个训练数据集与多个第一全连接网络一一关联,所述第一全连接网络的数量与所述用户历史数据的维度相同;
使用每个所述训练数据集对对应的所述第一全连接网络进行迭代训练;
计算多个所述第一全连接网络进行全连接计算的第一目标时间,根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重;
根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值;
当所述第一风险损失值达到第一预设阈值时,结束对多个所述第一全连接网络的迭代训练,得到流失预测模型;
使用所述流失预测模型基于目标用户的用户数据对所述目标用户进行流失预测。
在一个可选的实施方式中,所述计算多个所述第一全连接网络进行全连接计算的第一目标时间包括:
根据每个所述第一全连接网络的开始时间及结束时间计算得到对应的全连接网络进行全连接计算的时间;
将多个所述第一全连接网络进行全连接计算的时间进行加权平均计算得到所述第一目标时间。
在一个可选的实施方式中,所述根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重包括:
创建所述第一风险损失层的第一风险损失函数,所述第一风险损失函数包括多个第一风险损失子函数及每个第一风险损失子函数对应的第一权重,每个第一风险损失子函数对应一个第一全连接网络;
获取当前轮次之前的多轮历史迭代训练对应的第一目标时间,并根据所述多轮历史迭代训练对应的第一目标时间计算得到平均第一目标时间;
确定目标第一风险损失子函数;
判断所述当前轮次迭代训练对应的第一目标时间是否大于所述平均第一目标时间;
当所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,降低所述目标第一风险损失子函数对应的第一目标权重,并增加非目标第一风险损失子函数对应的第一目标权重,所述目标第一风险损失子函数对应的降低后的第一目标权重大于所述非目标第一风险损失子函数对应的增加后的第一目标权重;
当所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,增加所述目标第一风险损失子函数对应的第一目标权重,并降低所述非目标第一风险损失子函数对应的第一目标权重。
在一个可选的实施方式中,所述根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值包括:
获取每个所述第一全连接网络对应的期望结果;
计算所述第一全连接网络输出的第一结果与对应的期望结果之间的差值;
根据所述第一全连接网络对应的差值及所述第一目标权重计算第一风险损失值。
在一个可选的实施方式中,所述方法还包括:
将每个所述训练数据集与一个第二全连接网络进行关联,所述第二全连接网络的数量与所述用户历史数据的维度相同;
使用每个所述训练数据集对对应的所述第二全连接网络进行迭代训练;
根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重;
根据多个所述第二全连接网络输出的第二结果与所述多个第二目标权重计算第二风险损失值;
当所述第二风险损失值达到第二预设阈值时,结束对多个所述第二全连接网络的迭代训练,得到召回预测模型;
使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测。
在一个可选的实施方式中,所述根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重包括:
创建所述第二风险损失层的第二风险损失函数,所述第二风险损失函数包括多个第二风险损失子函数及每个第二风险损失子函数对应的第二权重,每个第二风险损失子函数对应一个第二全连接网络;
获取与所述第一结果对应的目标第二风险损失子函数;
根据所述第一结果对应的预测流失概率确定所述目标第二风险损失子函数对应的第二目标权重;
根据所述目标第二风险损失子函数对应的第二目标权重确定非目标第二风险损失子函数对应的第二目标权重。
在一个可选的实施方式中,所述使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测包括:
获取所述流失预测模型输出的预测流失概率;
使用所述召回预测模型基于所述目标用户的用户数据及所述预测流失概率进行召回预测,得到预测召回概率。
本发明的第二方面提供一种用户流失预测装置,所述装置包括:
关联模块,用于基于用户历史数据构建多个训练数据集,将所述多个训练数据集与多个第一全连接网络一一关联,所述第一全连接网络的数量与所述用户历史数据的维度相同;
训练模块,用于使用每个所述训练数据集对对应的所述第一全连接网络进行迭代训练;
调整模块,用于计算多个所述第一全连接网络进行全连接计算的第一目标时间,根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重;
计算模块,用于根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值;
结束模块,用于当所述第一风险损失值达到第一预设阈值时,结束对多个所述第一全连接网络的迭代训练,得到流失预测模型;
预测模块,用于使用所述流失预测模型基于目标用户的用户数据对所述目标用户进行流失预测。
本发明的第三方面提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述用户流失预测方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述用户流失预测方法。
综上所述,本发明所述的用户流失预测方法、装置、计算机设备及存储介质,将基于用户历史数据构建的每个训练数据集与一个第一全连接网络进行关联,第一全连接网络的数量与用户历史数据的维度相同;首先使用训练数据集对对应的第一全连接网络进行迭代训练;然后计算第一全连接网络进行全连接计算的第一目标时间,从而根据第一目标时间调整第一风险损失层的第一权重得到第一目标权重;接着根据第一全连接网络输出的第一结果与第一目标权重计算第一风险损失值,并在第一风险损失值达到第一预设阈值时得到流失预测模型;最后使用流失预测模型基于目标用户的用户数据对目标用户进行流失预测。本发明根据第一模板时间动态调整第一风险损失层的第一权重,以此来提高当前轮次迭代训练的训练效率,从而提高流失预测模型的训练效率;或者以此来提高当前轮次迭代训练的训练效果,从而提高流失预测模型的训练效果。
附图说明
图1是本发明实施例一提供的用户流失预测方法的流程图。
图2是本发明实施例提供的流失预测模型的网络架构图。
图3是本发明实施例提供的召回预测模型的网络架构图。
图4是本发明实施例二提供的用户流失预测装置的结构图。
图5是本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明实施例提供的用户流失预测方法由计算机设备执行,相应地,用户流失预测装置运行于计算机设备中。
图1是本发明实施例一提供的用户流失预测方法的流程图。所述用户流失预测方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,基于用户历史数据构建多个训练数据集,将所述多个训练数据集与多个第一全连接网络一一关联。
所述用户可以为保险代理人,在保险代理人的线索跟踪场景中,计算机设备可以获取被标记为预警的多个保险代理人的用户历史数据。
用户历史数据可以包括多个维度的数据,例如,第一维度的用户历史数据为在岗状态数据,第二维度的用户历史数据为在岗业绩数据,第三维度的用户历史数据为自然属性数据。所述在岗状态数据可以包括:代理人出勤率、参训率、课程学习完成度、考试通过率等。所述在岗业绩数据可以包括:代理人在岗时的月保费、销售产品件数和佣金等。所述自然属性数据可以包括代理人年龄、性别、岗前职业等。
被标记为预警的保险代理人的用户历史数据可以为预警且已流失的保险代理人的用户历史数据,也可以为预警但未流失的保险代理人的用户历史数据。
基于每个维度的用户历史数据构建一个训练数据集,训练数据集与第一全连接网络进行一一关联,所述第一全连接网络的数量与所述用户历史数据的维度相同,有多少个维度的用户历史数据,则构建多少个训练数据集,关联多少个第一全连接网络。示例性的,假设用户历史数据的维度为3,则训练数据集的数量为3,第一全连接网络的数量为3。
每个训练数据集可以包括正样本数据集和负样本数据集。所述正样本数据集为被标记为预警且已流失的多个保险代理人的用户历史数据构成的正样本的集合。所述负样本数据集为被标记为预警但未流失的多个保险代理人的用户历史数据构成的负样本的集合。
S12,使用每个所述训练数据集对对应的所述第一全连接网络进行迭代训练。
将保险代理人的在岗状态数据、在岗业绩数据及自然属性数据作为流失预测模型的输入,基于保险代理人的在岗状态数据、在岗业绩数据及自然属性数据迭代训练流失预测模型。
参阅图2所示,流失预测模型的网络架构可以包括:多个第一全连接网络、连接多个所述第一全连接网络的第一风险损失层及连接所述第一风险损失层的第一输出层,每个所述第一全连接网络为多层深度神经网络。不同的第一全连接网络的层数可以相同,也可以不同。
计算机设备将每个训练数据集输入至对应的第一全连接网络进行全连接计算,每个第一全连接网络将进行全连接计算后得到的第一结果输出给第一风险损失层,第一风险损失层进行风险损失计算,最后通过第一输出层输出预测流失概率。
S13,计算多个所述第一全连接网络进行全连接计算的第一目标时间,根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重。
计算机设备记录每轮迭代训练时多个第一全连接网络的开始时间和结束时间,计算所述开始时间及结束时间得到每轮迭代训练时多个第一全连接网络进行全连接计算的第一目标时间,从而根据第一目标时间调整第一风险损失层的多个第一权重。
在一个可选的实施例中,所述计算多个所述第一全连接网络进行全连接计算的第一目标时间包括:
根据每个所述第一全连接网络的开始时间及结束时间计算得到对应的全连接网络进行全连接计算的时间;
将多个所述第一全连接网络进行全连接计算的时间进行加权平均计算得到所述第一目标时间。
每个第一全连接网络进行全连接计算的开始时间可以认为是相同的,但不同的第一全连接网络进行全连接计算的结束时间不同。将多个第一全连接网络进行全连接计算的时间进行加权平均,能够得到这多个第一全连接网络进行全连接计算的第一目标时间,反映每轮迭代训练时多个第一全连接网络进行全连接计算所需的平均时间。
在将多个第一全连接网络进行全连接计算的时间进行加权平均计算时,可以为第一全连接网络进行全连接计算的时间设置相同的权重,也可以设置不同的权重,不做任何限制。
在一个可选的实施例中,所述根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重包括:
创建所述第一风险损失层的第一风险损失函数,所述第一风险损失函数包括多个第一风险损失子函数及每个第一风险损失子函数对应的第一权重,每个第一风险损失子函数对应一个第一全连接网络;
获取当前轮次之前的多轮历史迭代训练对应的第一目标时间,并根据所述多轮历史迭代训练对应的第一目标时间计算得到平均第一目标时间;
确定目标第一风险损失子函数;
判断所述当前轮次迭代训练对应的第一目标时间是否大于所述平均第一目标时间;
当所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,降低所述目标第一风险损失子函数对应的第一目标权重,并增加非目标第一风险损失子函数对应的第一目标权重,所述目标第一风险损失子函数对应的降低后的第一目标权重大于所述非目标第一风险损失子函数对应的增加后的第一目标权重;
当所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,增加所述目标第一风险损失子函数对应的第一目标权重,并降低所述非目标第一风险损失子函数对应的第一目标权重。
其中,所述第一风险损失函数包括的多个第一风险损失子函数的数量与多个所述第一全连接网络的数量相同,且一个第一风险损失子函数对应一个第一全连接网络,即使用每个第一风险损失子函数对对应的第一全连接网络的全连接计算结果进行风险损失计算。
示例性的,假设所述第一风险损失层的第一风险损失函数为
Figure DEST_PATH_IMAGE001
,第一全连接网络A1对应第一风险损失子函数
Figure 65182DEST_PATH_IMAGE002
,第一风险损失子函数
Figure 982322DEST_PATH_IMAGE002
用于计算多个保险代理人的在岗状态数据的风险损失值,第一全连接网络B1对应第一风险损失子函数
Figure DEST_PATH_IMAGE003
,第一风险损失子函数
Figure 824376DEST_PATH_IMAGE003
用于计算多个保险代理人的在岗业绩数据的风险损失值,第一全连接网络C1对应第一风险损失子函数
Figure 219586DEST_PATH_IMAGE004
,第一风险损失子函数
Figure 33958DEST_PATH_IMAGE004
用于计算多个保险代理人的自然属性数据的风险损失值,
Figure DEST_PATH_IMAGE005
Figure 856420DEST_PATH_IMAGE006
为第一权重。即第一风险损失函数包括带权重的业绩损失函数、带权重的状态损失函数和不带权重的自然属性损失函数。
第一轮次迭代训练过程中,每个第一风险损失子函数对应的第一权重采用默认设置值,默认设置业绩损失函数的第一权重小于状态损失函数的第一权重,业绩损失函数的第一权重与状态损失函数的第一权重之和为1。
通过对所述当前轮次迭代训练对应的第一目标时间与所述平均第一目标时间进行比较,来确定是否降低当前轮次迭代训练过程中所述目标第一风险损失子函数对应的第一目标权重。当所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,表明当前轮次迭代训练过程中,多个第一全连接网络进行全连接计算的时间较长,为了提高第一风险损失层计算风险损失函数的计算效率,则需要减少第一风险损失层计算风险损失函数的计算时间,以此来提高当前轮次迭代训练的训练效率,从而提高流失预测模型的训练效率;当所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,表明当前轮次迭代训练过程中,多个第一全连接网络进行全连接计算的时间较短,为了提高第一风险损失层计算风险损失函数的计算效果,则需要提高第一风险损失层计算风险损失函数的计算准确度,以此来提高当前轮次迭代训练的训练效果,从而提高流失预测模型的训练效果。
其中,所述目标第一风险损失子函数可以为预先指定的状态损失函数,所述非目标第一风险损失子函数可以为业绩损失函数。
该可选的实施例中,在所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,通过降低所述目标第一风险损失子函数对应的第一目标权重,并增加非目标第一风险损失子函数对应的第一目标权重,来减少计算目标第一风险损失子函数的计算时间,从而提高第一风险损失层计算风险损失函数的计算效率;在所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,通过增加所述目标第一风险损失子函数对应的第一目标权重,并降低所述非目标第一风险损失子函数对应的第一目标权重,来增加计算目标第一风险损失子函数的计算时间,从而提高第一风险损失层计算风险损失函数的计算效果。
所述当前轮次迭代训练对应的第一目标时间等于所述平均第一目标时间时的情况,即可适用于所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时的情况,也可适用于所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时的情况。本发明不做任何限制。
所述目标第一风险损失子函数对应的降低后的第一目标权重大于所述非目标第一风险损失子函数对应的增加后的第一目标权重,所述目标第一风险损失子函数对应的增加后的第一目标权重必定大于所述非目标第一风险损失子函数对应的降低后的第一目标权重,通过设置状态损失函数对应的第一权重更高,来提高代理人状态对流失的影响程度,从而提高代理人状态对流失预测模型的影响程度,进而提高流失预测模型的预测效果。
S14,根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值。
每个第一全连接网络进行全连接计算后输出第一结果至第一风险损失层,第一风险损失层根据多个第一结果及第一目标权重进行第一风险损失值的计算。
在一个可选的实施例中,所述根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值包括:
获取每个所述第一全连接网络对应的期望结果;
计算所述第一全连接网络输出的第一结果与对应的期望结果之间的差值;
根据所述第一全连接网络对应的差值及所述第一目标权重计算第一风险损失值。
其中,每个第一全连接网络输出的第一结果为预测的多个保险代理人是否流失的预测标签,所述期望结果为多个保险代理人是否流失的真实标签。
计算每个第一全连接网络输出的第一结果及对应的期望结果之间的差值,得到多个保险代理人是否流失的预测标签与真实标签之间的差值。差值越小,表明第一全连接网络的预测准确率越高;差值越大,表明第一全连接网络的预测准确率越低。
将每个第一全连接网络对应的差值及对应的第一目标权重进行叉乘计算,得到第一风险损失值。
S15,当所述第一风险损失值达到第一预设阈值时,结束对多个所述第一全连接网络的迭代训练,得到流失预测模型。
流失预测模型的目标是使用一个合适的损失函数来度量训练数据集的输出损失,对这个损失函数进行优化求极值。当第一风险损失值达到第一预设阈值,表明对应的第一全连接网络为最优网络,则结束对多个所述第一全连接网络的迭代训练,根据对应的多个第一全连接网络及第一风险损失层得到流失预测模型。
S16,使用所述流失预测模型基于目标用户的用户数据对所述目标用户进行流失预测。
其中,所述目标用户可以为准增员用户,即以某种方式、形态或形式表明了对某个产品或服务的兴趣的用户,通过对目标用户进行流失预测,来对目标用户进行销售线索跟踪,从而使目标用户成为增员用户。
计算机设备获取目标用户的在岗状态数据、在岗业绩数据及自然属性数据,并将目标用户的在岗状态数据、在岗业绩数据及自然属性数据输入所述流失预测模型进行预测,通过所述流失预测模型输出流失概率。流失概率用以表示目标用户流失的可能性,流失概率越大,目标用户流失的可能性越大,流失概率越小,目标用户流失的可能性越小。
在一个可选的实施例中,所述方法还包括:
将每个所述训练数据集与一个第二全连接网络进行关联;
使用每个所述训练数据集对对应的所述第二全连接网络进行迭代训练;
根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重;根据多个所述第二全连接网络输出的第二结果与所述多个第二目标权重计算第二风险损失值;
当所述第二风险损失值达到第二预设阈值时,结束对多个所述第二全连接网络的迭代训练,得到召回预测模型;
使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测。
参阅图3所示,召回预测模型的网络架构可以包括:多个第二全连接网络、连接多个所述第二全连接网络及第一输出层的第二风险损失层及连接所述第二风险损失层的第二输出层,每个所述第二全连接网络为多层深度神经网络。所述第二全连接网络的数量与所述用户历史数据的维度相同。不同的第二全连接网络的层数可以相同,也可以不同。所述第二全连接网络与所述第一全连接网络可以具有相同的网络结构,也可以具有不同的网络结构。
该可选的实施例中,对所述召回预测模型的训练过程同对所述流失预测模型的训练过程,不同的是,在训练召回预测模型时,除了根据多个第二全连接网络进行全连接计算的第二目标时间调整第二风险损失层的多个第二权重得到多个第二目标权重外,还需要结合在结束所述流失预测模型的训练时对应的多个所述第一全连接网络输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重。
每个第二全连接网络进行全连接计算后输出第二结果至第二风险损失层,第二风险损失层根据多个第二结果及第二目标权重进行第二风险损失值的计算。每个第二全连接网络输出的第二结果为预测的多个保险代理人是否召回的预测标签,所述第二全连接网络对应的期望结果为多个保险代理人是否召回的真实标签。计算每个第二全连接网络输出的第二结果及对应的期望结果之间的差值,得到多个保险代理人是否召回的预测标签与真实标签之间的差值。将每个第二全连接网络对应的差值及对应的第二目标权重进行叉乘计算,得到第二风险损失值。
该可选的实施例中,由于流失概率在一定程度上会影响召回概率,流失概率越大,召回概率越小,流失概率越小,召回概率越大,因此,在训练召回预测模型时,结合流失预测模型输出的流失概率,能够提高召回预测模型的训练精度,从而提高召回预测的准额度。
在一个可选的实施例中,所述根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重包括:
创建所述第二风险损失层的第二风险损失函数,所述第二风险损失函数包括多个第二风险损失子函数及每个第二风险损失子函数对应的第二权重,每个第二风险损失子函数对应一个第二全连接网络;
获取与所述第一结果对应的目标第二风险损失子函数;
根据所述第一结果对应的预测流失概率确定所述目标第二风险损失子函数对应的第二目标权重;
根据所述目标第二风险损失子函数对应的第二目标权重确定非目标第二风险损失子函数对应的第二目标权重。
其中,所述第二风险损失函数包括的多个第二风险损失子函数的数量与多个所述第二全连接网络的数量相同,且一个第二风险损失子函数对应一个第二全连接网络,即使用每个第二风险损失子函数对对应的第二全连接网络的全连接计算结果进行风险损失计算。
示例性的,假设所述第二风险损失层的第二风险损失函数为
Figure DEST_PATH_IMAGE007
,第二全连接网络A2对应第二风险损失子函数
Figure 185771DEST_PATH_IMAGE008
,第二风险损失子函数
Figure 384671DEST_PATH_IMAGE008
用于计算多个保险代理人的在岗状态数据的风险损失值,第二全连接网络B2对应第二风险损失子函数
Figure DEST_PATH_IMAGE009
,第二风险损失子函数
Figure 53549DEST_PATH_IMAGE009
用于计算多个保险代理人的在岗业绩数据的风险损失值,第二全连接网络C2对应第二风险损失子函数
Figure 46913DEST_PATH_IMAGE010
,第二风险损失子函数
Figure 801243DEST_PATH_IMAGE010
用于计算多个保险代理人的自然属性数据的风险损失值,
Figure DEST_PATH_IMAGE011
Figure 600571DEST_PATH_IMAGE012
为第二权重。即第二风险损失函数包括带权重的业绩损失函数、带权重的状态损失函数和不带权重的自然属性损失函数。
在第一轮召回预测模型的训练过程中,每个第二风险损失子函数对应的第二权重采用默认设置值,默认设置业绩损失函数的第二权重大于状态损失函数的第二权重,业绩损失函数的第二权重与状态损失函数的第二权重之和为1。
所述第一结果对应的目标第二风险损失子函数可以为状态损失函数,所述非目标第二风险损失子函数可以为业绩损失函数。当所述第一结果对应的预测流失概率小于预设概率阈值(例如,0.5)时,则将所述预测流失概率作为所述目标第二风险损失子函数对应的第二目标权重,将1与所述预测流失概率的差值作为所述非目标第二风险损失子函数对应的第二目标权重。当所述第一结果对应的预测流失概率大于或者等于预设概率阈值(例如,0.5)时,则将所述预测流失概率的预设比例值作为所述目标第二风险损失子函数对应的第二目标权重,将1与所述预测流失概率的预设比例值的差值作为所述非目标第二风险损失子函数对应的第二目标权重。
该可选的实施例中,通过设置业绩损失函数的第二权重更高,来提高代理人流失前的业绩对召回的影响程度。
在一个可选的实施例中,所述使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测包括:
获取所述流失预测模型输出的预测流失概率;
使用所述召回预测模型基于所述目标用户的用户数据及所述预测流失概率进行召回预测,得到预测召回概率。
在对目标用户进行召回预测时,基于目标用户的用户数据及目标用户的流失概率双重数据共同预测目标用户被召回的可能性,召回概率准确度较高。通过预测召回率可以有效的帮助企业进行流失会员预警并干预召回,减少用户流失率,加强用户的忠诚度。
需要强调的是,为进一步保证上述流失预测模型和召回预测模型的私密性和安全性,上述流失预测模型和召回预测模型可存储于区块链的节点中。
图4是本发明实施例二提供的用户流失预测装置的结构图。
在一些实施例中,所述用户流失预测装置40可以包括多个由计算机程序段所组成的功能模块。所述用户流失预测装置40中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)用户流失预测的功能。
本实施例中,所述用户流失预测装置40根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:关联模块401、训练模块402、调整模块403、计算模块404、结束模块405及预测模块406。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述关联模块401,用于基于用户历史数据构建多个训练数据集,将所述多个训练数据集与多个第一全连接网络一一关联。
所述用户可以为保险代理人,在保险代理人的线索跟踪场景中,计算机设备可以获取被标记为预警的多个保险代理人的用户历史数据。
用户历史数据可以包括多个维度的数据,例如,第一维度的用户历史数据为在岗状态数据,第二维度的用户历史数据为在岗业绩数据,第三维度的用户历史数据为自然属性数据。所述在岗状态数据可以包括:代理人出勤率、参训率、课程学习完成度、考试通过率等。所述在岗业绩数据可以包括:代理人在岗时的月保费、销售产品件数和佣金等。所述自然属性数据可以包括代理人年龄、性别、岗前职业等。
被标记为预警的保险代理人的用户历史数据可以为预警且已流失的保险代理人的用户历史数据,也可以为预警但未流失的保险代理人的用户历史数据。
基于每个维度的用户历史数据构建一个训练数据集,训练数据集与第一全连接网络进行一一关联,所述第一全连接网络的数量与所述用户历史数据的维度相同,有多少个维度的用户历史数据,则构建多少个训练数据集,关联多少个第一全连接网络。示例性的,假设用户历史数据的维度为3,则训练数据集的数量为3,第一全连接网络的数量为3。
每个训练数据集可以包括正样本数据集和负样本数据集。所述正样本数据集为被标记为预警且已流失的多个保险代理人的用户历史数据构成的正样本的集合。所述负样本数据集为被标记为预警但未流失的多个保险代理人的用户历史数据构成的负样本的集合。
所述训练模块402,用于使用每个所述训练数据集对对应的所述第一全连接网络进行迭代训练。
将保险代理人的在岗状态数据、在岗业绩数据及自然属性数据作为流失预测模型的输入,基于保险代理人的在岗状态数据、在岗业绩数据及自然属性数据迭代训练流失预测模型。
参阅图2所示,流失预测模型的网络架构可以包括:多个第一全连接网络、连接多个所述第一全连接网络的第一风险损失层及连接所述第一风险损失层的第一输出层,每个所述第一全连接网络为多层深度神经网络。不同的第一全连接网络的层数可以相同,也可以不同。
计算机设备将每个训练数据集输入至对应的第一全连接网络进行全连接计算,每个第一全连接网络将进行全连接计算后得到的第一结果输出给第一风险损失层,第一风险损失层进行风险损失计算,最后通过第一输出层输出预测流失概率。
所述调整模块403,用于计算多个所述第一全连接网络进行全连接计算的第一目标时间,根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重。
计算机设备记录每轮迭代训练时多个第一全连接网络的开始时间和结束时间,计算所述开始时间及结束时间得到每轮迭代训练时多个第一全连接网络进行全连接计算的第一目标时间,从而根据第一目标时间调整第一风险损失层的多个第一权重。
在一个可选的实施例中,所述调整模块403计算多个所述第一全连接网络进行全连接计算的第一目标时间包括:
根据每个所述第一全连接网络的开始时间及结束时间计算得到对应的全连接网络进行全连接计算的时间;
将多个所述第一全连接网络进行全连接计算的时间进行加权平均计算得到所述第一目标时间。
每个第一全连接网络进行全连接计算的开始时间可以认为是相同的,但不同的第一全连接网络进行全连接计算的结束时间不同。将多个第一全连接网络进行全连接计算的时间进行加权平均,能够得到这多个第一全连接网络进行全连接计算的第一目标时间,反映每轮迭代训练时多个第一全连接网络进行全连接计算所需的平均时间。
在将多个第一全连接网络进行全连接计算的时间进行加权平均计算时,可以为第一全连接网络进行全连接计算的时间设置相同的权重,也可以设置不同的权重,不做任何限制。
在一个可选的实施例中,所述调整模块403根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重包括:
创建所述第一风险损失层的第一风险损失函数,所述第一风险损失函数包括多个第一风险损失子函数及每个第一风险损失子函数对应的第一权重,每个第一风险损失子函数对应一个第一全连接网络;
获取当前轮次之前的多轮历史迭代训练对应的第一目标时间,并根据所述多轮历史迭代训练对应的第一目标时间计算得到平均第一目标时间;
确定目标第一风险损失子函数;
判断所述当前轮次迭代训练对应的第一目标时间是否大于所述平均第一目标时间;
当所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,降低所述目标第一风险损失子函数对应的第一目标权重,并增加非目标第一风险损失子函数对应的第一目标权重,所述目标第一风险损失子函数对应的降低后的第一目标权重大于所述非目标第一风险损失子函数对应的增加后的第一目标权重;
当所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,增加所述目标第一风险损失子函数对应的第一目标权重,并降低所述非目标第一风险损失子函数对应的第一目标权重。
其中,所述第一风险损失函数包括的多个第一风险损失子函数的数量与多个所述第一全连接网络的数量相同,且一个第一风险损失子函数对应一个第一全连接网络,即使用每个第一风险损失子函数对对应的第一全连接网络的全连接计算结果进行风险损失计算。
示例性的,假设所述第一风险损失层的第一风险损失函数为
Figure 123957DEST_PATH_IMAGE001
,第一全连接网络A1对应第一风险损失子函数
Figure 553801DEST_PATH_IMAGE002
,第一风险损失子函数
Figure 857743DEST_PATH_IMAGE002
用于计算多个保险代理人的在岗状态数据的风险损失值,第一全连接网络B1对应第一风险损失子函数
Figure 132867DEST_PATH_IMAGE003
,第一风险损失子函数
Figure 776338DEST_PATH_IMAGE003
用于计算多个保险代理人的在岗业绩数据的风险损失值,第一全连接网络C1对应第一风险损失子函数
Figure 111504DEST_PATH_IMAGE004
,第一风险损失子函数
Figure 840426DEST_PATH_IMAGE004
用于计算多个保险代理人的自然属性数据的风险损失值,
Figure 919240DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE013
1为第一权重。即第一风险损失函数包括带权重的业绩损失函数、带权重的状态损失函数和不带权重的自然属性损失函数。
第一轮次迭代训练过程中,每个第一风险损失子函数对应的第一权重采用默认设置值,默认设置业绩损失函数的第一权重小于状态损失函数的第一权重,业绩损失函数的第一权重与状态损失函数的第一权重之和为1。
通过对所述当前轮次迭代训练对应的第一目标时间与所述平均第一目标时间进行比较,来确定是否降低当前轮次迭代训练过程中所述目标第一风险损失子函数对应的第一目标权重。当所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,表明当前轮次迭代训练过程中,多个第一全连接网络进行全连接计算的时间较长,为了提高第一风险损失层计算风险损失函数的计算效率,则需要减少第一风险损失层计算风险损失函数的计算时间,以此来提高当前轮次迭代训练的训练效率,从而提高流失预测模型的训练效率;当所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,表明当前轮次迭代训练过程中,多个第一全连接网络进行全连接计算的时间较短,为了提高第一风险损失层计算风险损失函数的计算效果,则需要提高第一风险损失层计算风险损失函数的计算准确度,以此来提高当前轮次迭代训练的训练效果,从而提高流失预测模型的训练效果。
其中,所述目标第一风险损失子函数可以为预先指定的状态损失函数,所述非目标第一风险损失子函数可以为业绩损失函数。
该可选的实施例中,在所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,通过降低所述目标第一风险损失子函数对应的第一目标权重,并增加非目标第一风险损失子函数对应的第一目标权重,来减少计算目标第一风险损失子函数的计算时间,从而提高第一风险损失层计算风险损失函数的计算效率;在所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,通过增加所述目标第一风险损失子函数对应的第一目标权重,并降低所述非目标第一风险损失子函数对应的第一目标权重,来增加计算目标第一风险损失子函数的计算时间,从而提高第一风险损失层计算风险损失函数的计算效果。
所述当前轮次迭代训练对应的第一目标时间等于所述平均第一目标时间时的情况,即可适用于所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时的情况,也可适用于所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时的情况。本发明不做任何限制。
所述目标第一风险损失子函数对应的降低后的第一目标权重大于所述非目标第一风险损失子函数对应的增加后的第一目标权重,所述目标第一风险损失子函数对应的增加后的第一目标权重必定大于所述非目标第一风险损失子函数对应的降低后的第一目标权重,通过设置状态损失函数对应的第一权重更高,来提高代理人状态对流失的影响程度,从而提高代理人状态对流失预测模型的影响程度,进而提高流失预测模型的预测效果。
所述计算模块404,用于根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值。
每个第一全连接网络进行全连接计算后输出第一结果至第一风险损失层,第一风险损失层根据多个第一结果及第一目标权重进行第一风险损失值的计算。
在一个可选的实施例中,所述计算模块404根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值包括:
获取每个所述第一全连接网络对应的期望结果;
计算所述第一全连接网络输出的第一结果与对应的期望结果之间的差值;
根据所述第一全连接网络对应的差值及所述第一目标权重计算第一风险损失值。
其中,每个第一全连接网络输出的第一结果为预测的多个保险代理人是否流失的预测标签,所述期望结果为多个保险代理人是否流失的真实标签。
计算每个第一全连接网络输出的第一结果及对应的期望结果之间的差值,得到多个保险代理人是否流失的预测标签与真实标签之间的差值。差值越小,表明第一全连接网络的预测准确率越高;差值越大,表明第一全连接网络的预测准确率越低。
将每个第一全连接网络对应的差值及对应的第一目标权重进行叉乘计算,得到第一风险损失值。
所述结束模块405,用于当所述第一风险损失值达到第一预设阈值时,结束对多个所述第一全连接网络的迭代训练,得到流失预测模型。
流失预测模型的目标是使用一个合适的损失函数来度量训练数据集的输出损失,对这个损失函数进行优化求极值。当第一风险损失值达到第一预设阈值,表明对应的第一全连接网络为最优网络,则结束对多个所述第一全连接网络的迭代训练,根据对应的多个第一全连接网络及第一风险损失层得到流失预测模型。
所述预测模块406,用于使用所述流失预测模型基于目标用户的用户数据对所述目标用户进行流失预测。
其中,所述目标用户可以为准增员用户,即以某种方式、形态或形式表明了对某个产品或服务的兴趣的用户,通过对目标用户进行流失预测,来对目标用户进行销售线索跟踪,从而使目标用户成为增员用户。
计算机设备获取目标用户的在岗状态数据、在岗业绩数据及自然属性数据,并将目标用户的在岗状态数据、在岗业绩数据及自然属性数据输入所述流失预测模型进行预测,通过所述流失预测模型输出流失概率。流失概率用以表示目标用户流失的可能性,流失概率越大,目标用户流失的可能性越大,流失概率越小,目标用户流失的可能性越小。
在一个可选的实施例中,所述关联模块401还用于:将每个所述训练数据集与一个第二全连接网络进行关联。
所述训练模块402,还用于使用每个所述训练数据集对对应的所述第二全连接网络进行迭代训练。
所述调整模块403,还用于根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重。
所述计算模块404,还用于根据多个所述第二全连接网络输出的第二结果与所述多个第二目标权重计算第二风险损失值。
所述结束模块405,还用于当所述第二风险损失值达到第二预设阈值时,结束对多个所述第二全连接网络的迭代训练,得到召回预测模型。
所述预测模块406,还用于使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测。
参阅图3所示,召回预测模型的网络架构可以包括:多个第二全连接网络、连接多个所述第二全连接网络及第一输出层的第二风险损失层及连接所述第二风险损失层的第二输出层,每个所述第二全连接网络为多层深度神经网络。所述第二全连接网络的数量与所述用户历史数据的维度相同。不同的第二全连接网络的层数可以相同,也可以不同。所述第二全连接网络与所述第一全连接网络可以具有相同的网络结构,也可以具有不同的网络结构。
该可选的实施例中,对所述召回预测模型的训练过程同对所述流失预测模型的训练过程,不同的是,在训练召回预测模型时,除了根据多个第二全连接网络进行全连接计算的第二目标时间调整第二风险损失层的多个第二权重得到多个第二目标权重外,还需要结合在结束所述流失预测模型的训练时对应的多个所述第一全连接网络输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重。
每个第二全连接网络进行全连接计算后输出第二结果至第二风险损失层,第二风险损失层根据多个第二结果及第二目标权重进行第二风险损失值的计算。每个第二全连接网络输出的第二结果为预测的多个保险代理人是否召回的预测标签,所述第二全连接网络对应的期望结果为多个保险代理人是否召回的真实标签。计算每个第二全连接网络输出的第二结果及对应的期望结果之间的差值,得到多个保险代理人是否召回的预测标签与真实标签之间的差值。将每个第二全连接网络对应的差值及对应的第二目标权重进行叉乘计算,得到第二风险损失值。
该可选的实施例中,由于流失概率在一定程度上会影响召回概率,流失概率越大,召回概率越小,流失概率越小,召回概率越大,因此,在训练召回预测模型时,结合流失预测模型输出的流失概率,能够提高召回预测模型的训练精度,从而提高召回预测的准额度。
在一个可选的实施例中,所述根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重包括:
创建所述第二风险损失层的第二风险损失函数,所述第二风险损失函数包括多个第二风险损失子函数及每个第二风险损失子函数对应的第二权重,每个第二风险损失子函数对应一个第二全连接网络;
获取与所述第一结果对应的目标第二风险损失子函数;
根据所述第一结果对应的预测流失概率确定所述目标第二风险损失子函数对应的第二目标权重;
根据所述目标第二风险损失子函数对应的第二目标权重确定非目标第二风险损失子函数对应的第二目标权重。
其中,所述第二风险损失函数包括的多个第二风险损失子函数的数量与多个所述第二全连接网络的数量相同,且一个第二风险损失子函数对应一个第二全连接网络,即使用每个第二风险损失子函数对对应的第二全连接网络的全连接计算结果进行风险损失计算。
示例性的,假设所述第二风险损失层的第二风险损失函数为
Figure 479535DEST_PATH_IMAGE014
,第二全连接网络A2对应第二风险损失子函数
Figure DEST_PATH_IMAGE015
,第二风险损失子函数
Figure 378745DEST_PATH_IMAGE015
用于计算多个保险代理人的在岗状态数据的风险损失值,第二全连接网络B2对应第二风险损失子函数
Figure 329383DEST_PATH_IMAGE016
,第二风险损失子函数
Figure 274206DEST_PATH_IMAGE016
用于计算多个保险代理人的在岗业绩数据的风险损失值,第二全连接网络C2对应第二风险损失子函数
Figure DEST_PATH_IMAGE017
,第二风险损失子函数
Figure 626690DEST_PATH_IMAGE017
用于计算多个保险代理人的自然属性数据的风险损失值,
Figure 569238DEST_PATH_IMAGE011
Figure 7172DEST_PATH_IMAGE012
为第二权重。即第二风险损失函数包括带权重的业绩损失函数、带权重的状态损失函数和不带权重的自然属性损失函数。
在第一轮召回预测模型的训练过程中,每个第二风险损失子函数对应的第二权重采用默认设置值,默认设置业绩损失函数的第二权重大于状态损失函数的第二权重,业绩损失函数的第二权重与状态损失函数的第二权重之和为1。
所述第一结果对应的目标第二风险损失子函数可以为状态损失函数,所述非目标第二风险损失子函数可以为业绩损失函数。当所述第一结果对应的预测流失概率小于预设概率阈值(例如,0.5)时,则将所述预测流失概率作为所述目标第二风险损失子函数对应的第二目标权重,将1与所述预测流失概率的差值作为所述非目标第二风险损失子函数对应的第二目标权重。当所述第一结果对应的预测流失概率大于或者等于预设概率阈值(例如,0.5)时,则将所述预测流失概率的预设比例值作为所述目标第二风险损失子函数对应的第二目标权重,将1与所述预测流失概率的预设比例值的差值作为所述非目标第二风险损失子函数对应的第二目标权重。
该可选的实施例中,通过设置业绩损失函数的第二权重更高,来提高代理人流失前的业绩对召回的影响程度。
在一个可选的实施例中,所述使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测包括:
获取所述流失预测模型输出的预测流失概率;
使用所述召回预测模型基于所述目标用户的用户数据及所述预测流失概率进行召回预测,得到预测召回概率。
在对目标用户进行召回预测时,基于目标用户的用户数据及目标用户的流失概率双重数据共同预测目标用户被召回的可能性,召回概率准确度较高。通过预测召回率可以有效的帮助企业进行流失会员预警并干预召回,减少用户流失率,加强用户的忠诚度。
需要强调的是,为进一步保证上述流失预测模型和召回预测模型的私密性和安全性,上述流失预测模型和召回预测模型可存储于区块链的节点中。
参阅图5所示,为本发明实施例三提供的计算机设备的结构示意图。在本发明较佳实施例中,所述计算机设备5包括存储器51、至少一个处理器52、至少一条通信总线53及收发器54。
本领域技术人员应该了解,图5示出的计算机设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机设备5还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述计算机设备5是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述计算机设备5还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述计算机设备5仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器51中存储有计算机程序,所述计算机程序被所述至少一个处理器52执行时实现如所述的用户流失预测方法中的全部或者部分步骤。所述存储器51包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器52是所述计算机设备5的控制核心(Control Unit),利用各种接口和线路连接整个计算机设备5的各个部件,通过运行或执行存储在所述存储器51内的程序或者模块,以及调用存储在所述存储器51内的数据,以执行计算机设备5的各种功能和处理数据。例如,所述至少一个处理器52执行所述存储器中存储的计算机程序时实现本发明实施例中所述的用户流失预测方法的全部或者部分步骤;或者实现用户流失预测装置的全部或者部分功能。所述至少一个处理器52可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线53被设置为实现所述存储器51以及所述至少一个处理器52等之间的连接通信。
尽管未示出,所述计算机设备5还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器52逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备5还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。本发明陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种用户流失预测方法,其特征在于,所述方法包括:
基于用户历史数据构建多个训练数据集,将所述多个训练数据集与多个第一全连接网络一一关联,所述第一全连接网络的数量与所述用户历史数据的维度相同;
使用每个所述训练数据集对对应的所述第一全连接网络进行迭代训练;
计算多个所述第一全连接网络进行全连接计算的第一目标时间,根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重;
根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值;
当所述第一风险损失值达到第一预设阈值时,结束对多个所述第一全连接网络的迭代训练,得到流失预测模型;
使用所述流失预测模型基于目标用户的用户数据对所述目标用户进行流失预测。
2.如权利要求1所述的用户流失预测方法,其特征在于,所述计算多个所述第一全连接网络进行全连接计算的第一目标时间包括:
根据每个所述第一全连接网络的开始时间及结束时间计算得到对应的全连接网络进行全连接计算的时间;
将多个所述第一全连接网络进行全连接计算的时间进行加权平均计算得到所述第一目标时间。
3.如权利要求2所述的用户流失预测方法,其特征在于,所述根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重包括:
创建所述第一风险损失层的第一风险损失函数,所述第一风险损失函数包括多个第一风险损失子函数及每个第一风险损失子函数对应的第一权重,每个第一风险损失子函数对应一个第一全连接网络;
获取当前轮次之前的多轮历史迭代训练对应的第一目标时间,并根据所述多轮历史迭代训练对应的第一目标时间计算得到平均第一目标时间;
确定目标第一风险损失子函数;
判断所述当前轮次迭代训练对应的第一目标时间是否大于所述平均第一目标时间;
当所述当前轮次迭代训练对应的第一目标时间大于所述平均第一目标时间时,降低所述目标第一风险损失子函数对应的第一目标权重,并增加非目标第一风险损失子函数对应的第一目标权重,所述目标第一风险损失子函数对应的降低后的第一目标权重大于所述非目标第一风险损失子函数对应的增加后的第一目标权重;
当所述当前轮次迭代训练对应的第一目标时间小于所述平均第一目标时间时,增加所述目标第一风险损失子函数对应的第一目标权重,并降低所述非目标第一风险损失子函数对应的第一目标权重。
4.如权利要求3所述的用户流失预测方法,其特征在于,所述根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值包括:
获取每个所述第一全连接网络对应的期望结果;
计算所述第一全连接网络输出的第一结果与对应的期望结果之间的差值;
根据所述第一全连接网络对应的差值及所述第一目标权重计算第一风险损失值。
5.如权利要求1至4中任意一项所述的用户流失预测方法,其特征在于,所述方法还包括:
将每个所述训练数据集与一个第二全连接网络进行关联,所述第二全连接网络的数量与所述用户历史数据的维度相同;
使用每个所述训练数据集对对应的所述第二全连接网络进行迭代训练;
根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重;
根据多个所述第二全连接网络输出的第二结果与所述多个第二目标权重计算第二风险损失值;
当所述第二风险损失值达到第二预设阈值时,结束对多个所述第二全连接网络的迭代训练,得到召回预测模型;
使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测。
6.如权利要求5所述的用户流失预测方法,其特征在于,所述根据多个所述第一全连接网络在迭代训练结束时输出的第一结果调整第二风险损失层的多个第二权重得到多个第二目标权重包括:
创建所述第二风险损失层的第二风险损失函数,所述第二风险损失函数包括多个第二风险损失子函数及每个第二风险损失子函数对应的第二权重,每个第二风险损失子函数对应一个第二全连接网络;
获取与所述第一结果对应的目标第二风险损失子函数;
根据所述第一结果对应的预测流失概率确定所述目标第二风险损失子函数对应的第二目标权重;
根据所述目标第二风险损失子函数对应的第二目标权重确定非目标第二风险损失子函数对应的第二目标权重。
7.如权利要求5所述的用户流失预测方法,其特征在于,所述使用所述召回预测模型基于所述目标用户的用户数据对所述目标用户进行召回预测包括:
获取所述流失预测模型输出的预测流失概率;
使用所述召回预测模型基于所述目标用户的用户数据及所述预测流失概率进行召回预测,得到预测召回概率。
8.一种用户流失预测装置,其特征在于,所述装置包括:
关联模块,用于基于用户历史数据构建多个训练数据集,将所述多个训练数据集与多个第一全连接网络一一关联,所述第一全连接网络的数量与所述用户历史数据的维度相同;
训练模块,用于使用每个所述训练数据集对对应的所述第一全连接网络进行迭代训练;
调整模块,用于计算多个所述第一全连接网络进行全连接计算的第一目标时间,根据所述第一目标时间调整第一风险损失层的多个第一权重得到多个第一目标权重;
计算模块,用于根据多个所述第一全连接网络输出的第一结果与所述多个第一目标权重计算第一风险损失值;
结束模块,用于当所述第一风险损失值达到第一预设阈值时,结束对多个所述第一全连接网络的迭代训练,得到流失预测模型;
预测模块,用于使用所述流失预测模型基于目标用户的用户数据对所述目标用户进行流失预测。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的用户流失预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的用户流失预测方法。
CN202110448391.3A 2021-04-25 2021-04-25 用户流失预测方法、装置、计算机设备及存储介质 Active CN112862546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110448391.3A CN112862546B (zh) 2021-04-25 2021-04-25 用户流失预测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110448391.3A CN112862546B (zh) 2021-04-25 2021-04-25 用户流失预测方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112862546A true CN112862546A (zh) 2021-05-28
CN112862546B CN112862546B (zh) 2021-08-13

Family

ID=75992854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110448391.3A Active CN112862546B (zh) 2021-04-25 2021-04-25 用户流失预测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112862546B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548523A (zh) * 2022-01-26 2022-05-27 深圳市傲天科技股份有限公司 用户观影信息预测方法、装置、设备及存储介质
CN115952904A (zh) * 2022-12-29 2023-04-11 广东南方财经控股有限公司 基于分步关联权重的预测模型构建方法、预测方法及装置
CN116664184A (zh) * 2023-07-31 2023-08-29 广东南方电信规划咨询设计院有限公司 基于联邦学习的客户流失预测方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292250A (zh) * 2017-05-31 2017-10-24 西安科技大学 一种基于深度神经网络的步态识别方法
CN109285038A (zh) * 2018-10-16 2019-01-29 浪潮软件集团有限公司 一种通过bp神经网络预测银行客户流失的方法
CN109583651A (zh) * 2018-12-03 2019-04-05 焦点科技股份有限公司 一种保险电商平台用户流失预测的方法和装置
CN109754281A (zh) * 2018-11-22 2019-05-14 筑客网络技术(上海)有限公司 一种供应商流失预测方法
CN109933699A (zh) * 2019-03-05 2019-06-25 中国科学院文献情报中心 一种学术画像模型的构建方法及装置
CN110322085A (zh) * 2018-03-29 2019-10-11 北京九章云极科技有限公司 一种客户流失预测方法和装置
CN111709714A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于人工智能的流失人员预测方法和装置
CN111898810A (zh) * 2020-07-16 2020-11-06 上海松鼠课堂人工智能科技有限公司 基于师生交流用户流失预测系统
WO2020227320A1 (en) * 2019-05-06 2020-11-12 Inferati Inc. Accurate, real-time and secure privacy-preserving verification of biometrics or other sensitive information
CN112381154A (zh) * 2020-11-17 2021-02-19 深圳壹账通智能科技有限公司 预测用户概率的方法、装置和计算机设备
CN112561598A (zh) * 2020-12-23 2021-03-26 中国农业银行股份有限公司重庆市分行 基于客户画像的客户流失预测及挽回方法和系统
CN112613920A (zh) * 2020-12-31 2021-04-06 中国农业银行股份有限公司 一种流失几率预测方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292250A (zh) * 2017-05-31 2017-10-24 西安科技大学 一种基于深度神经网络的步态识别方法
CN110322085A (zh) * 2018-03-29 2019-10-11 北京九章云极科技有限公司 一种客户流失预测方法和装置
CN109285038A (zh) * 2018-10-16 2019-01-29 浪潮软件集团有限公司 一种通过bp神经网络预测银行客户流失的方法
CN109754281A (zh) * 2018-11-22 2019-05-14 筑客网络技术(上海)有限公司 一种供应商流失预测方法
CN109583651A (zh) * 2018-12-03 2019-04-05 焦点科技股份有限公司 一种保险电商平台用户流失预测的方法和装置
CN109933699A (zh) * 2019-03-05 2019-06-25 中国科学院文献情报中心 一种学术画像模型的构建方法及装置
WO2020227320A1 (en) * 2019-05-06 2020-11-12 Inferati Inc. Accurate, real-time and secure privacy-preserving verification of biometrics or other sensitive information
CN111709714A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于人工智能的流失人员预测方法和装置
CN111898810A (zh) * 2020-07-16 2020-11-06 上海松鼠课堂人工智能科技有限公司 基于师生交流用户流失预测系统
CN112381154A (zh) * 2020-11-17 2021-02-19 深圳壹账通智能科技有限公司 预测用户概率的方法、装置和计算机设备
CN112561598A (zh) * 2020-12-23 2021-03-26 中国农业银行股份有限公司重庆市分行 基于客户画像的客户流失预测及挽回方法和系统
CN112613920A (zh) * 2020-12-31 2021-04-06 中国农业银行股份有限公司 一种流失几率预测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHOUIEKH, A等: "Deep Convolutional Neural Networks for Customer Churn Prediction Analysis", 《INTERNATIONAL JOURNAL OF COGNITIVE INFORMATICS AND NATURAL INTELLIGENCE》 *
于瑞云等: "基于改进GA-BP的移动通信用户流失预测算法", 《东北大学学报(自然科学版)》 *
张磊: "基于深度学习的电信客户流失预测研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548523A (zh) * 2022-01-26 2022-05-27 深圳市傲天科技股份有限公司 用户观影信息预测方法、装置、设备及存储介质
CN114548523B (zh) * 2022-01-26 2023-11-07 深圳市傲天科技股份有限公司 用户观影信息预测方法、装置、设备及存储介质
CN115952904A (zh) * 2022-12-29 2023-04-11 广东南方财经控股有限公司 基于分步关联权重的预测模型构建方法、预测方法及装置
CN116664184A (zh) * 2023-07-31 2023-08-29 广东南方电信规划咨询设计院有限公司 基于联邦学习的客户流失预测方法及装置
CN116664184B (zh) * 2023-07-31 2024-01-12 广东南方电信规划咨询设计院有限公司 基于联邦学习的客户流失预测方法及装置

Also Published As

Publication number Publication date
CN112862546B (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN112862546B (zh) 用户流失预测方法、装置、计算机设备及存储介质
CN111950738B (zh) 机器学习模型优化效果评估方法、装置、终端及存储介质
CN112256886B (zh) 图谱中的概率计算方法、装置、计算机设备及存储介质
CN108537399B (zh) 一种物料需求量的预测方法及装置
CN110995459B (zh) 异常对象识别方法、装置、介质及电子设备
WO2021139432A1 (zh) 基于人工智能的用户等级预测方法、装置、终端及介质
CN112562378B (zh) 公交车调度方法、装置、计算机设备及介质
CN112651563B (zh) 负荷预测方法、装置、计算机可读存储介质及电子设备
CN113435998B (zh) 贷款逾期预测方法、装置、电子设备及存储介质
Ben Ali et al. Reliable state of health condition monitoring of Li-ion batteries based on incremental support vector regression with parameters optimization
US10956976B2 (en) Recommending shared products
CN114880449B (zh) 智能问答的答复生成方法、装置、电子设备及存储介质
Liu et al. Decision-theoretic rough sets with probabilistic distribution
CN109345373A (zh) 核销风险预警方法、装置、电子设备及计算机可读介质
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
CN111625196A (zh) 区块链节点扩容方法、装置、计算机设备及存储介质
CN112330432B (zh) 风险等级识别模型训练方法、识别方法、终端及存储介质
CN113850439A (zh) 轨道交通站点设备能耗预测方法、装置、设备和存储介质
CN111652282B (zh) 基于大数据的用户偏好分析方法、装置及电子设备
Hernández et al. Primary user characterization for cognitive radio wireless networks using long short-term memory
CN111967581A (zh) 分群模型的解释方法、装置、计算机设备和存储介质
CN109215795B (zh) 病例复杂度预测方法及系统
CN112365051A (zh) 代理人留存预测方法、装置、计算机设备及存储介质
CN112381595B (zh) 基于交往行为的用户价值预测方法及相关设备
CN112036641B (zh) 基于人工智能的留存预测方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant