CN111639814A

CN111639814A - 预测变动行为发生概率的方法、装置、介质和电子设备

Info

Publication number: CN111639814A
Application number: CN202010489726.1A
Authority: CN
Inventors: 李嘉晨; 郭凯
Original assignee: Beike Technology Co Ltd
Current assignee: Seashell Housing Beijing Technology Co Ltd
Priority date: 2020-06-02
Filing date: 2020-06-02
Publication date: 2020-09-08

Abstract

公开了一种预测变动行为发生概率的方法、装置、介质以及电子设备。其中的方法包括：获取待预测对象的状态特征以及所述待预测对象的至少一行为的历史统计量；根据各行为的历史统计量，获取各行为的时序特征；根据各行为的历史统计量，预测所述待预测对象在未来预定时间段内各行为的未来预计量；根据所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测所述待预测对象的变动行为发生概率。本公开提供的技术方案有利于提高变动行为发生概率的预测准确性。

Description

预测变动行为发生概率的方法、装置、介质和电子设备

技术领域

本公开涉及计算机技术，尤其是涉及一种预测变动行为发生概率的方法、预测变动行为发生概率的装置、存储介质以及电子设备。

背景技术

员工的频繁流动往往对公司不利。例如，对于居间行业而言，优秀的经纪人对于公司的经营能力而言，是非常重要的，优秀的经纪人可以为公司带来较多的客户以及交易标的。如何较为准确的预测出员工的变动行为发生概率，以避免员工的变动行为发生现象，是一个值得关注的技术问题。

发明内容

为了解决上述技术问题，提出了本公开。本公开的实施例提供了一种预测变动行为发生概率的方法、预测变动行为发生概率的装置、存储介质以及电子设备。

根据本公开实施例的一个方面，提供了一种预测变动行为发生概率的方法，该方法包括：获取待预测对象的状态特征以及所述待预测对象的至少一行为的历史统计量；根据各行为的历史统计量，获取各行为的时序特征；根据各行为的历史统计量，预测所述待预测对象在未来预定时间段内各行为的未来预计量；根据所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测所述待预测对象的变动行为发生概率。

在本公开一实施方式中，所述根据各行为的历史统计量，获取各行为的时序特征，包括：根据各行为的历史统计量中的基于单位时长的历史统计量进行时序分解，获得各行为的趋势分量、各行为的周期分量以及各行为的余项分量；根据所述各行为的趋势分量，分别获取各行为的基于单调区间斜率的第一特征；根据所述各行为的周期分量，分别获取各行为的基于正弦波的第二特征；根据所述各行为的余项分量，分别获取各行为的用于表征所述待预测对象不稳定性的第三特征。

在本公开又一实施方式中，所述根据所述各行为的趋势分量，获取各行为的基于单调区间斜率的第一特征，包括：针对所述待预测对象的任一行为，获取该行为的趋势分量形成的最后一个单调区间的斜率；根据所述斜率以及所述待预测对象所属群体的斜率均值，确定该行为的第一特征。

在本公开再一实施方式中，所述根据所述各行为的周期分量，获取各行为的基于正弦波的第二特征，包括：针对所述待预测对象的任一行为，根据该行为的周期分量，获取该行为的正弦波拟合参数；根据所述正弦波拟合参数，确定相邻正弦波顶点间的距离；根据所述距离以及所述待预测对象所属群体的相邻正弦波顶点间的距离均值，确定该行为的第二特征。

在本公开再一实施方式中，所述根据所述各行为的余项分量，获取各行为的用于表征所述待预测对象不稳定性的第三特征，包括：针对所述待预测对象的任一行为，根据该行为的余项分量，获取该行为的变异系数；根据所述变异系数以及所述待预测对象所属群体的变异系数均值，确定该行为的第三特征。

在本公开再一实施方式中，所述方法还包括：根据所述各行为的趋势分量，获取各行为的突变点距离当前时间的时间间隔；其中，所述突变点为：距离最后一个单调区间最近，且对应时长超过预定时长的单调区间的起点；和/或，根据所述各行为的余项分量，获取各行为的异常点数量；其中，所述异常点为：超过余项分量的标准差预定倍数的点；其中，所述各行为的时间间隔和/或各行为的异常点数量用于：与所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量一起，预测所述待预测对象的变动行为发生概率。

在本公开再一实施方式中，所述根据各行为的历史统计量，预测所述待预测对象在未来预定时间段内各行为的未来预计量，包括：针对所述待预测对象的任一行为，根据该行为的历史统计量，预测该行为在未来预定时间段内的行为量范围以及该行为在未来预定时间段内的预定行为量。

在本公开再一实施方式中，所述针对所述待预测对象的任一行为，根据该行为的历史统计量，预测该行为在未来预定时间段内的行为量范围以及该行为在未来预定时间段内的预定行为量，包括：针对所述待预测对象的任一行为，将该行为的历史统计量中的基于单位时长的历史统计量，作为模型输入提供给该行为对应的差分整合移动平均自回归ARIMA模型；根据该行为对应的ARIMA模型的输出，获得该行为在未来预定时间段内的行为量范围、以及该行为在未来预定时间段内的预定行为量。

在本公开再一实施方式中，所述根据所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测所述待预测对象的变动行为发生概率，包括：至少将所述状态特征、各行为的历史统计量中的基于历史时长的历史统计量、各行为的时序特征以及各行为的未来预计量，作为模型输入，提供给预测模型；确定所述预测模型输出的概率值所属的区间；根据所述区间对应的调整系数，对所述概率值进行调整，获得所述待预测对象的变动行为发生概率；其中，所述历史时长包括多个单位时长，所述调整系数为基于后验的调整系数。

根据本公开实施例的另一个方面，提供了一种预测变动行为发生概率的装置，该装置包括：第一获取模块，用于获取待预测对象的状态特征以及所述待预测对象的至少一行为的历史统计量；第二获取模块，用于根据各行为的历史统计量，获取各行为的时序特征；第一预测模块，用于根据各行为的历史统计量，预测所述待预测对象在未来预定时间段内各行为的未来预计量；第二预测模块，用于根据所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测所述待预测对象的变动行为发生概率。

在本公开一实施方式中，所述第二获取模块，包括：第一子模块，用于根据各行为的历史统计量中的基于单位时长的历史统计量进行时序分解，获得各行为的趋势分量、各行为的周期分量以及各行为的余项分量；第二子模块，用于根据所述各行为的趋势分量，分别获取各行为的基于单调区间斜率的第一特征；第三子模块，用于根据所述各行为的周期分量，分别获取各行为的基于正弦波的第二特征；第四子模块，用于根据所述各行为的余项分量，分别获取各行为的用于表征所述待预测对象不稳定性的第三特征。

在本公开又一实施方式中，所述第二子模块进一步用于：针对所述待预测对象的任一行为，获取该行为的趋势分量形成的最后一个单调区间的斜率；根据所述斜率以及所述待预测对象所属群体的斜率均值，确定该行为的第一特征。

在本公开再一实施方式中，所述第三子模块进一步用于：针对所述待预测对象的任一行为，根据该行为的周期分量，获取该行为的正弦波拟合参数；根据所述正弦波拟合参数，确定相邻正弦波顶点间的距离；根据所述距离以及所述待预测对象所属群体的相邻正弦波顶点间的距离均值，确定该行为的第二特征。

在本公开再一实施方式中，所述第四子模块进一步用于：针对所述待预测对象的任一行为，根据该行为的余项分量，获取该行为的变异系数；根据所述变异系数以及所述待预测对象所属群体的变异系数均值，确定该行为的第三特征。

在本公开再一实施方式中，所述装置还包括：第三获取模块，用于根据所述各行为的趋势分量，获取各行为的突变点距离当前时间的时间间隔；其中，所述突变点为：距离最后一个单调区间最近，且对应时长超过预定时长的单调区间的起点；和/或，第四获取模块，用于根据所述各行为的余项分量，获取各行为的异常点数量；其中，所述异常点为：超过余项分量的标准差预定倍数的点；其中，所述各行为的时间间隔和/或各行为的异常点数量用于：与所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量一起，预测所述待预测对象的变动行为发生概率。

在本公开再一实施方式中，所述第一预测模块包括：第五子模块，用于针对所述待预测对象的任一行为，根据该行为的历史统计量，预测该行为在未来预定时间段内的行为量范围以及该行为在未来预定时间段内的预定行为量。

在本公开再一实施方式中，所述第五子模块进一步用于：针对所述待预测对象的任一行为，将该行为的历史统计量中的基于单位时长的历史统计量，作为模型输入提供给该行为对应的差分整合移动平均自回归ARIMA模型；根据该行为对应的ARIMA模型的输出，获得该行为在未来预定时间段内的行为量范围、以及该行为在未来预定时间段内的预定行为量。

在本公开再一实施方式中，所述第二预测模块，包括：第六子模块，用于至少将所述状态特征、各行为的历史统计量中的基于历史时长的历史统计量、各行为的时序特征以及各行为的未来预计量，作为模型输入，提供给预测模型；

第七子模块，用于确定所述预测模型输出的概率值所属的区间；第八子模块，用于根据所述区间对应的调整系数，对所述概率值进行调整，获得所述待预测对象的变动行为发生概率；其中，所述历史时长包括多个单位时长，所述调整系数为基于后验的调整系数。

根据本公开实施例的再一方面，提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述预测变动行为发生概率的方法。

根据本公开实施例的又一方面，提供一种电子设备，该电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令，以实现上述预测变动行为发生概率的方法。

基于本公开上述实施例提供的一种预测变动行为发生概率的方法和装置，通过利用待预测对象的各行为的历史统计量，不仅可以获取到各行为的时序特征，还可以预测出待预测对象在未来预定时间段内各行为的未来预计量，由于行为的时序特征和行为的未来预计量可以在行为的历史统计量的基础上，更进一步的刻画出待预测对象的行为发展趋势等特点，例如，在待预测对象在一时间点产生变动行为发生的观念时，该待预测对象在该时间点之后的行为方式往往会与其之前的行为方式不相同，从而使行为发展趋势产生变化；因此，本公开在预测待预测对象的变动行为发生概率时，通过参考待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，有利于使预测过程建立在更全面的信息基础之上。由此可知，本公开提供的技术方案有利于提高变动行为发生概率的预测准确性。

下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同描述一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1为本公开的预测变动行为发生概率的方法一个实施例的流程图；

图2为本公开的待预测对象的一行为的趋势分量的一个例子的示意图；

图3为本公开的待预测对象的一行为的周期分量的一个例子的示意图；

图4为本公开的待预测对象的一行为的余项分量的一个例子的示意图；

图5为图2、图3和图4综合起来形成的总览图的一个例子的示意图；

图6为本公开的获取行为的第二特征一个实施例的流程图；

图7为本公开的校正预测模型输出的变动行为发生概率一实施例的流程图；

图8为本公开的训练预测模型一实施例的流程图；

图9为本公开的预测变动行为发生概率的装置一个实施例的结构示意图；

图10为本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面将参考附图详细地描述根据本公开的示例实施例。显然，所描述的实施例仅仅是本公开的一部分实施例，而不是本公开的全部实施例，应理解，本公开不受这里描述的示例实施例的限制。

应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解，本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

还应理解，在本公开实施例中，“多个”可以指两个或者两个以上，“至少一个”可以指一个、两个或两个以上。

还应理解，对于本公开实施例中提及的任一部件、数据或结构，在没有明确限定或者在前后文给出相反启示的情况下，一般可以理解为一个或多个。

另外，本公开中术语“和/或”，仅是一种描述关联对象的关联关系，表示可以存在三种关系，如A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本公开中字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，本公开对各个实施例的描述着重强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，不再一一赘述。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本公开的实施例可以应用于终端设备、计算机系统、服务器等电子设备，其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与终端设备、计算机系统或者服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于：个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境等等。

终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中，任务可以是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

本公开概述

在实现本公开的过程中，发明人发现，目前通常是基于待预测对象的行为的历史统计量和状态特征，来预测待预测对象的离职等变动行为发生概率的。具体的，先基于已变动行为发生员工和未变动行为发生员工的状态特征和行为的历史统计量，形成具有表征员工在某一个历史时间点之后的N天内是否已变动行为发生标签的训练样本，并利用大量的训练样本对预测模型进行训练，在成功训练预测模型后，将待预测对象的状态特征和行为的历史统计量作为模型输入提供给该预测模型，由该预测模型输出待预测对象在未来N天的变动行为发生概率。

由于预测模型从上述训练样本学习到的信息仅限于状态特征和行为的统计量，因此，在预测模型针对待预测对象进行变动行为发生概率预测时，其参考的信息过于单一，不利于提高预测变动行为发生概率的准确性。

示例性概述

本公开提供的预测变动行为发生概率的技术的应用场景的一个例子如下：

在房产领域，本公开可以定时(如每个自然月的第一天等)的从当前入职人员信息表以及当前多种操作日志等历史业务数据中，获得一个区域(如一个城市或者一个行政区等)中的每一个当前在职房产经纪人的状态特征、以及每一个当前在职房产经纪人的多个行为的历史统计量。本公开可以利用每一个当前在职房产经纪人的多个行为的历史统计量，至少获得每一个当前在职房产经纪人的多个行为的时序特征和每一个当前在职房产经纪人的多个行为的未来预计量。之后，本公开可以至少利用每一个当前在职房产经纪人的状态特征、每一个当前在职房产经纪人的多个行为的历史统计量、每一个当前在职房产经纪人的多个行为的时序特征、以及每一个当前在职房产经纪人的多个行为的未来预计量，来预测每一个当前在职房产经纪人的变动行为发生概率。本公开可以将预测结果提供给公司的相关部门(如人力资源部门等)，从而为公司的相关部门对当前在职的所有房产经纪人的管理，提供一个参考信息。例如，公司的相关部门可以通过人文关怀以及奖励等措施，降低优秀的房产经纪人的不满情绪。再例如，公司的相关部门可以提前采取相应的措施，降低变动行为发生高风险的房产经纪人在流失过程中给公司带来的损失等。

示例性方法

图1为本公开的预测变动行为发生概率的方法一个实施例的流程图。图1所示的实施例的方法包括：S100、S101、S102以及S103。下面对各步骤分别进行说明。

S100、获取待预测对象的状态特征以及待预测对象的至少一行为的历史统计量。

本公开中的待预测对象可以是指公司的员工。例如，待预测对象可以为居间行业的经纪人等。本公开中的待预测对象的状态特征可以是指待预测对象所具有的不随着待预测对象的后期行为而发生变化的特征。例如，待预测对象的状态特征可以为待预测对象的性别、待预测对象的年龄、以及待预测对象的入职时长等。待预测对象的状态特征也可以称为待预测对象的社会属性特征或者时不变属性特征等。

本公开中的待预测对象的行为通常与待预测对象从事的行业相关，即待预测对象的行为可以是指待预测对象从事的行业所涉及到的行为。例如，对于房产领域而言，待预测对象的行为可以包括：房产经纪人的产生商机的行为、房产经纪人带客户看房屋的行为以及房产经纪人的被委托行为等。在下述描述中，虽然是以这三种行为为例进行说明的，但是应该了解的是，本公开并不限制待预测对象的行为的具体表现形式。

本公开中的待预测对象的行为的历史统计量可以是指：通过对待预测对象在预定历史时间段内的行为进行累积汇总，而获得的行为量。具体的，本公开中的行为的历史统计量可以包括：基于单位时长(如一天或者一周等)的历史统计量以及基于历史时长(如N1天或者N1周等，且N1可以为大于1的整数)的历史统计量。本公开中的历史时长通常包括：多个单位时长。一个例子，本公开可以通过对待预测对象在最近N1天内的每一天产生商机的行为、每一天带客户看房屋的行为以及每一天被委托行为等，分别进行累计汇总，从而获得该待预测对象在最近N1天中的每一天的商机量、每一天的带看量和每一天的委托量等。再一个例子，本公开可以通过对待预测对象在最近N1天内的产生商机的行为、带客户看房屋的行为以及被委托行为等，分别进行行为数量的累计汇总，从而获得该待预测对象在最近N1天内的总商机量、总带看量和总委托量等。

S101、根据各行为的历史统计量，获取各行为的时序特征。

本公开中的行为的时序特征可以是指行为在单位时长的时间序列(如以天为单位的时间序列或者以周为单位的时间序列等)上所呈现出的特征。本公开可以采用时间序列分解算法对每一个行为的历史统计量(如基于单位时长的历史统计量)分别进行处理，从而获得每一个行为的时序特征。

S102、根据各行为的历史统计量，预测待预测对象在未来预定时间段内各行为的未来预计量。

本公开中的待预测对象在未来预定时间段内各行为的未来预计量可以是指待预测对象在未来预定时间段(如未来N2天或者未来N2周等，N2为大于等于1的整数)内，执行各行为的行为量。本公开可以利用预先设置的模型执行待预测对象在未来预定时间段内各行为的未来预计量的预测处理操作。

S103、根据状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测待预测对象的变动行为发生概率。

本公开中的变动行为可以是指不同于预定状态的行为。其中的预定状态可以根据实际需求设置。例如，预定状态可以为正常工作状态等。在预定状态为正常工作状态的情况下，变动行为可以为离职或者请长假等。本公开对变动行为的具体表现形式不作限定。

本公开中的待预测对象的变动行为发生概率可以是指：待预测对象在未来一时间段(如未来N3天，且N3为大于等于1的整数)内变动行为发生的可能性。本公开可以利用预先设置的模型执行待预测对象的变动行为发生概率的预测处理操作。

本公开通过利用待预测对象的各行为的历史统计量，不仅可以获取到各行为的时序特征，还可以预测出待预测对象在未来预定时间段内各行为的未来预计量，由于行为的时序特征和行为的未来预计量可以在行为的历史统计量的基础上，更进一步的刻画出待预测对象的行为发展趋势等特点，例如，在待预测对象在一时间点产生变动行为发生的观念时，该待预测对象在该时间点之后的行为方式往往会与其之前的行为方式不相同，从而使行为发展趋势产生变化；因此，本公开在预测待预测对象的变动行为发生概率时，通过参考待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，有利于使预测过程建立在更全面的信息基础之上。由此可知，本公开提供的技术方案有利于提高变动行为发生概率的预测准确性。

在一个可选示例中，本公开可以从当前存储的入职人员信息表中获取至少一位员工的状态特征，作为至少一待预测对象的状态特征。本公开可以定期从当前存储的入职人员信息表中获得当前所有在职员工的员工标识、性别以及年龄等状态特征，从而可以定期的获得当前所有在职员工的变动行为发生概率。

在一个可选示例中，本公开可以从当前存储的多种行为日志中获取至少一待预测对象的多种行为的历史统计量。其中的行为的历史统计量可以包括：行为在一历史时长中的每一个单位时长(如一天或者一周等)内的历史统计量以及行为在一历史时长(如N1天或者N1周等，且N1可以为大于1的整数)内的历史统计量。行为在一历史时长内的历史统计量可以称为总历史统计量。

一个例子，本公开可以利用当前所有在职员工的员工标识，从当前存储的商机日志中获得当前每一位在职员工的最近N1天内的总商机量以及当前每一位在职员工在最近N1天内的每一天的商机量。

另一个例子，本公开可以利用当前所有在职员工的员工标识，从当前存储的带看日志中获得当前每一位在职员工的最近N1天内的总带看量以及当前每一位在职员工在最近N1天内的每一天的带看量。

再一个例子，本公开可以利用当前所有在职员工的员工标识，从当前存储的委托日志中获得当前每一位在职员工的最近N1天内的总委托量以及当前每一位在职员工在最近N1天内的每一天的委托量。

更具体而言，假设待预测对象为房产经纪人，且待预测对象的所有行为至少包括：房产经纪人的产生商机的行为、房产经纪人带客户看房屋的行为以及房产经纪人的被委托行为，则本公开获得的每一待预测对象的上述三个行为的历史统计量的一个例子，如下述表1和表2所示：

表1

表2

需要特别说明的是，表1和表2仅以一天的商机量、N1天的总商机量、一天的带看量、N1天的总带看量、一天的委托量以及N1天的总委托量为历史统计量为例，对统计获得的各待预测对象的三个行为的历史统计量进行说明，本公开中的历史统计量不仅可以在上述表1和表2的基础上包括更多内容，还可以根据实际行业中的行为等发生相应的变化。本公开对行为的历史统计量不作限定。

另外，对于ID为0001的待预测对象而言，表2和表3中的数据存在如下对应关系：x₁1+……+x_N11＝x1，y₁1+……+y_N11＝y1，且z₁1+……+z_N11＝z1。同理，其他待预测对象也存在上述对应关系。

本公开通过获取待预测对象的行为在一历史时长中的每一个单位时长内的历史统计为量以及待预测对象的行为在一历史时长内的历史统计量，不仅能够为待预测对象的变动行为发生概率的预测提供数据基础，而且有利于为后续的各行为的时序分解提供数据基础。

在一个可选示例中，本公开利用一待预测对象的各行为的历史统计量获取到的该待预测对象的各行为的时序特征可以包括：该待预测对象的每一个行为的趋势的基于单调区间斜率的第一特征、该待预测对象的每一个行为的周期性的基于正弦波的第二特征、以及该待预测对象的每一个行为的用于表征该待预测对象不稳定性的第三特征中的至少一个。

可选的，本公开可以在采用时序分解方式的基础上，获得待预测对象的各行为的时序特征。具体的，本公开可以先对待预测对象的每一个行为的历史统计量中的基于单位时长的历史统计量，分别进行时序分解处理，从而获得每一个行为的趋势分量(也可以称为趋势项，即trend component)、每一个行为的周期分量(也可以称为季节分量或者周期项等，即seasonal component)以及每一个行为的余项分量(也可以称为残差分量或者残差项等，即remainder component)；之后，本公开可以根据待预测对象的每一个行为的趋势分量，获取到待预测对象的每一个行为的基于单调区间斜率的第一特征，根据每一个行为的周期分量(如年周期分量)，获取到待预测对象的每一个行为的基于正弦波的第二特征，并根据每一个行为的余项分量，获取到待预测对象的每一个行为的用于表征待预测对象不稳定性的第三特征。其中的基于单调区间斜率的第一特征可以是指由趋势分量形成的单调区间的斜率形成的特征。其中的基于正弦波的第二特征可以是指由周期分量形成的正弦波上的多个点形成的特征。其中的用于表征待预测对象不稳定性的第三特征可以是指由余项分量中的异常点形成的特征。其中的异常点通常不同于余项分量中的大多数点。

本公开通过获得待预测对象的每一个行为的第一特征、第二特征以及第三特征，由于行为的第一特征可以表示出行为在发展趋势上的特点，第二特征可以表示出行为在时间周期性上的特点，且其中的时间周期性可以表示出行业的淡季和旺季等；而第三特征可以表示出在待预测对象存在的不稳定现象上的特点，而待预测对象在产生变动行为发生观念之后，其行为很可能会产生不同以往的异常，而且该异常很可能会在上述三个特征中有所体现，因此，本公开在对待预测对象进行变动行为发生概率的预测时，通过参考待预测对象的每一个行为的第一特征、第二特征以及第三特征，有利于使预测过程建立在更全面的信息基础之上，进而有利于提高预测的准确性。

可选的，本公开可以采用STL(Seasonal-Trend decomposition procedure basedon LOESS，基于LOESS的季节-趋势分解过程)算法对待预测对象的每一个行为的历史统计量中的基于单位时长的历史统计量，分别进行时序分解处理。STL算法可以采用加法模型算法或者乘法模型算法等。一个更为具体的例子：

本公开可以采用STL算法对表2中的ID为0001的待预测对象的x₁1、……以及x_N11进行时序分解处理，获得ID为0001的待预测对象的产生商机的行为的趋势分量、产生商机的行为的周期分量以及产生商机的行为的余项分量。本公开可以采用STL算法对表2中的ID为0002的待预测对象的x₁2、……及x_N12进行时序分解处理，获得ID为0002的待预测对象的产生商机的行为的趋势分量、产生商机的行为的周期分量以及产生商机的行为的余项分量。以此类推，本公开可以采用STL算法对表2中的ID为n的待预测对象的x₁n、……以及x_N1n进行时序分解处理，获得ID为n的待预测对象的产生商机的行为的趋势分量、产生商机的行为的周期分量以及产生商机的行为的余项分量。

本公开可以采用STL算法对表2中的ID为0001的待预测对象的y₁1、……以及y_N11进行时序分解处理，获得ID为0001的待预测对象的带客户看房屋的行为的趋势分量、带客户看房屋的行为的周期分量以及带客户看房屋的行为的余项分量。本公开可以采用STL算法对表2中的ID为0002的待预测对象的y₁2、……以及y_N12进行时序分解处理，获得ID为0002的待预测对象的带客户看房屋的行为的趋势分量、带客户看房屋的行为的周期分量以及带客户看房屋的行为的余项分量。以此类推，本公开可以采用STL算法对表2中的ID为n的待预测对象的y₁n、……以及y_N1n进行时序分解处理，获得ID为n的待预测对象的带客户看房屋的行为的趋势分量、带客户看房屋的行为的周期分量以及带客户看房屋的行为的余项分量。

本公开可以采用STL算法对表2中的ID为0001的待预测对象的z₁1、……以及z_N11进行时序分解处理，获得ID为0001的待预测对象的被委托行为的趋势分量、被委托行为的周期分量以及被委托行为的行为的余项分量。本公开可以采用STL算法对表2中的ID为0002的待预测对象的z₁2、……以及z_N12进行时序分解处理，获得ID为0002的待预测对象的被委托行为的趋势分量、被委托行为的周期分量以及被委托行为的余项分量。以此类推，本公开可以采用STL算法对表2中的ID为n的待预测对象的z₁n、……以及z_N1n进行时序分解处理，获得ID为n的待预测对象的被委托行为的趋势分量、被委托行为的周期分量以及被委托行为的余项分量。

可选的，本公开利用图形的方式表示一待预测对象的一行为的趋势分量的一个例子如图2所示。本公开利用图形表示一待预测对象的一行为的周期分量的一个例子如图3所示。本公开利用图形表示一待预测对象的一行为的余项分量的一个例子如图4所示。

可选的，在STL算法采用加法算法模型的情况下，图2、图3以及图4综合起来形成的总览图的一个例子，如图5所示。图2至图5中的横坐标轴均为时间轴，例如，横坐标轴表示从2012年的8月开始至2013年的12月为止，这一总历史时长，横坐标轴上的一个单位刻度表示一个月。图2、图4和图5中的纵坐标轴均为数量轴。图3的纵坐标轴为正弦的幅度轴。

可选的，假设待预测对象为房产经纪人，且待预测对象的所有行为包括：房产经纪人的产生商机的行为、房产经纪人带客户看房屋的行为以及房产经纪人的被委托行为，则本公开获得的每一位待预测对象的上述三个行为的时序分解处理结果的数据结构的一个例子，如下述表3所示：

表3

在一个可选示例中，本公开根据各行为的趋势分量，获取各行为的基于单调区间斜率的第一特征的一个例子可以为：针对待预测对象的任一行为而言，先获取该行为的趋势分量形成的最后一个单调区间(如图2中的最后一个单调区间)的斜率；例如，本公开可以采用一二阶线性拟合方式，获得趋势分量的多个单调区间，并从中挑选出最后一个单调区间，从而获得最后一个单调区间的斜率。之后，本公开可以根据上述获得的斜率以及待预测对象所属群体的斜率均值，确定该行为的第一特征。例如，本公开可以将上述斜率与斜率均值的差值以及斜率均值作为该行为的第一特征。再例如，本公开可以将上述斜率以及斜率均值作为该行为的第一特征。本公开中的待预测对象所属群体可以是指：公司的一个部门或者公司在一个行政区划内的所有门店或者整个公司所包含的所有对象个体形成的群体。对于任一行为而言，本公开中的待预测对象所属群体的斜率均值可以是指：待预测对象所属群体所包括的所有对象个体的该行为的趋势分量形成的所有最后一个单调区间的斜率的平均值。另外，在一个例子中，上述所有对象个体可以包括待预测对象。在另一个例子中，上述所有对象个体可以不包括待预测对象。

一个更为具体的例子，针对待预测对象的产生商机的行为，本公开可以先采用一二阶线性拟合方式，获得产生商机的行为的趋势分量形成的最后一个单调区间的斜率k，假设待预测对象所属群体包含m个对象个体，本公开可以分别获取每一个对象个体的产生商机的行为的趋势分量所形成的最后一个单调区间的斜率，从而获得m个斜率，并计算m个斜率的均值，获得均值K。本公开可以将k和K作为待预测对象的产生商机的行为的第一特征。本公开也可以将k-K以及K作为待预测对象的产生商机的行为的第一特征。同理，采用上述方式还可以分别获得待预测对象的带客户看房屋的行为的第一特征以及被委托行为的第一特征。

由于待预测对象的各行为的趋势分量分别形成的最后一个单调区间的斜率可以表示出待预测对象在当前时间点的各行为趋势，而待预测对象所属群体的斜率均值可以表示出待预测对象所在群体在当前时间点的平均行为趋势，因此，本公开中的待预测对象的各行为的第一特征可以表示出待预测对象在当前时间点的各行为与当前时间点的群体行为的差异，从而有利于明确的刻画出待预测对象的行为特点，进而有利于提高预测的准确性。

在一个可选示例中，本公开根据各行为的周期分量，获取各行为的基于正弦波的第二特征的一个例子如图6所示。

图6中，S600、针对待预测对象的任一行为，根据该行为的周期分量，获取该行为的正弦波拟合参数。

可选的，本公开中的正弦波拟合参数可以是指决定正弦波形状的参数。即本公开需要利用该行为的周期分量拟合出一正弦波，例如，图3所示的正弦波。用于描述拟合出的该正弦波的参数即为该行为的正弦波拟合参数。本公开可以采用现有的多种正弦波曲线拟合算法等获得该行为的正弦波拟合参数，具体过程在此不再详细说明。

可选的，本公开获得的正弦波拟合参数可以包括：幅度、频率、相位和直流分量等。

S601、根据上述获得的正弦波拟合参数，确定相邻正弦波顶点间的距离。

可选的，本公开可以利用正弦波拟合参数获得正弦波曲线上的所有顶点，本公开可以将任意一时间(如最近时间)或者任意多个时间分别作为一时间点，以每一个时间点为基点，分别获得两个相邻的正弦波顶点，例如，对于一时间点而言，获得与该时间点距离最近的两个相邻的正弦波顶点。之后，对于任一时间点对应的两个相邻的正弦波顶点，获得这两个相邻的正弦波顶点之间的距离。

S602、根据上述距离以及待预测对象所属群体的相邻正弦波顶点间的距离均值，确定该行为的第二特征。

可选的，本公开中的待预测对象所属群体可以是指：公司的一个部门或者公司在一个行政区划内的所有门店或者整个公司所包含的所有对象个体形成的群体。对于任一行为而言，本公开中的待预测对象所属群体的相邻正弦波顶点间的距离均值的获取方式可以为：先获取待预测对象所属群体所包括的所有对象个体的该行为的正弦波拟合参数，从而本公开可以根据每一个对象个体的正弦波拟合参数获得每一个对象个体的正弦波，之后，本公开可以获得每一个正弦波上的两个相邻的正弦波顶点间的距离，即获得多个距离，这多个距离的均值即为待预测对象所属群体两个相邻正弦波顶点间的距离均值。另外，在一个例子中，上述所有对象个体可以包括待预测对象。在另一例子中，上述所有对象个体可以不包括待预测对象。需要特别说明的是，待预测对象的相邻正弦波顶点的位置与所有对象个体的相邻正弦波顶点的位置应该是相同的。也就是说，待预测对象的相邻正弦波顶点对应的时间点与所有对象个体的相邻正弦波顶点对应的时间点应该是相同的。如果将待预测对象的相邻正弦波顶点称为待预测对象的基于预定时间点的向量正弦波顶点，则所有对象个体的相邻正弦波顶点可以称为所有对象个体的基于该预定时间点的向量正弦波顶点。

可选的，对于任一时间点而言，本公开可以将该时间点对应的距离与该时间点对应的距离均值的差值、以及该时间点对应的距离均值作为该行为的第二特征。本公开也可以将该时间点对应的距离以及该时间点对应的距离均值作为该行为的第二特征。利用上述图6所示的流程，本公开可以获得待预测对象的每一个行为的基于正弦波的第二特征。

一个更为具体的例子，针对待预测对象的产生商机的行为，本公开可以先获取产生商机的行为的正弦波参数形成的正弦波中的最后两个顶点间的距离s，假设待预测对象所属群体包含m个对象个体，本公开可以分别获取每一个对象个体的产生商机的行为的正弦波参数形成的正弦波中的最后两个顶点间的距离，从而获得m个距离，并计算m个距离的均值，获得均值S。本公开可以将s和S作为待预测对象的产生商机的行为的第二特征。本公开也可以将s-S以及S作为待预测对象的产生商机的行为的第二特征。同理，采用上述方式还可以分别获得待预测对象的带客户看房屋的行为的第二特征以及被委托行为的第二特征。

由于待预测对象的一行为对应的正弦波中的基于时间点的相邻顶点(如最后两个相邻顶点)间的距离可以表示出待预测对象在相应季节(如淡季、旺季等)上的行为特点，而待预测对象所属群体的距离均值可以表示出待预测对象所在群体在相应季节(如淡季、旺季等)上的行为特点，因此，本公开中的待预测对象的各行为的第二特征可以表示出待预测对象在相应季节的各行为与群体行为的差异，从而有利于明确的刻画出待预测对象的行为特点，进而有利于提高预测的准确性。

在一个可选示例中，本公开可以使用行为的变异系数，来衡量待预测对象的不稳定性。具体的，本公开根据各行为的余项分量，获取各行为的用于表征待预测对象不稳定性的第三特征的一个例子可以为：针对待预测对象的任一行为而言，本公开可以先根据该行为的余项分量，获取该行为的变异系数；之后，再根据该行为的变异系数以及待预测对象所属群体的变异系数均值，确定该行为的第三特征。例如，本公开可以将上述变异系数与变异系数均值的差值以及变异系数均值作为该行为的第三特征。再例如，本公开可以将上述变异系数以及变异系数均值作为该行为的第三特征。本公开中的变异系数可以是指：余项标准差与余项均值的比值。本公开中的余项分量包括多个余项值(如图4中的多个时间点各自对应的Y值)，本公开可以利用多个余项值计算出余项标准差以及余项均值。本公开中的待预测对象所属群体可以是指：公司的一个部门或者公司在一个行政区划内的所有门店或者整个公司所包含的所有对象个体形成的群体。对于任一行为而言，本公开中的待预测对象所属群体的变异系数均值可以是指：待预测对象所属群体所包括的所有对象个体的该行为的余项分量形成的变异系数的平均值。另外，在一个例子中，上述所有对象个体可以包括待预测对象。在另一例子中，上述所有对象个体可以不包括待预测对象。

一个更为具体的例子，针对待预测对象的产生商机的行为，本公开可以先获取产生商机的行为的余项分量形成的余项标准差和余项均值，并计算余项标准差和余项均值的比值，获得待预测对象的产生商机的行为的变异系数r，假设待预测对象所属群体包含m个对象个体，本公开可以分别获取每一个对象个体的产生商机的行为的余项分量所形成的余项标准差以及余项均值，从而获得m个余项标准差和余项均值的比值，即获得m个变异系数，计算m个变异系数的均值，获得变异系数均值R。本公开可以将r和R作为待预测对象的产生商机的行为的第三特征。本公开也可以将r-R以及R作为待预测对象的产生商机的行为的第三特征。同理，采用上述方式还可以分别获得待预测对象的带客户看房屋的行为的第三特征以及被委托行为的第三特征。

由于待预测对象的一行为的余项分量所形成的变异系数可以表示出待预测对象的不稳定性，而待预测对象所属群体的变异系数均值可以表示出待预测对象所在群体的平均不稳定性，因此，本公开中的待预测对象的各行为的第三特征可以表示出待预测对象在不同方面表现出的不稳定性分别与群体在不同方面表现出的不稳定性之间的差异，从而有利于明确的刻画出待预测对象在不稳定性上的特点，进而有利于提高预测的准确性。

在一个可选示例中，本公开不仅可以根据待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测待预测对象的变动行为发生概率，还可以在上述信息的基础上，与其他信息一起进行待预测对象的变动行为发生概率的预测。例如，本公开可以根据待预测对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量以及各行为的突变点距离当前时间的时间间隔，预测待预测对象的变动行为发生概率。再例如，本公开可以根据待预测对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量以及各行为的异常点数量，预测待预测对象的变动行为发生概率。再例如，本公开可以根据待预测对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量、各行为的突变点距离当前时间的时间间隔以及各行为的异常点数量，预测待预测对象的变动行为发生概率。

可选的，本公开可以根据待预测对象的各行为的趋势分量，获取各行为的突变点距离当前时间的时间间隔。本公开中的突变点可以为：距离趋势分量所形成的最后一个单调区间最近，且对应时长超过预定时长的单调区间的起点。也就是说，突变点所在的单调区间应满足如下三个条件：

1、突变点所在的单调区间与最后一个单调区间为两个不同的单调区间；

2、突变点所在的单调区间所跨越的时长应超过预定时长；例如，突变点所在的单调区间所跨越的时长应超过一周等；

3、突变点所在的单调区间军力最后一个单调区间最近。

可选的，本公开可以根据待预测对象的各行为的余项分量，获取各行为的异常点数量。本公开中的异常点可以为：数值超过标准差预定倍数的点。本公开中的余项分量包括多个余项值(如图4中的多个时间点各自对应的Y值)，本公开可以利用多个余项值计算出余项标准差，如果一个余项值超过该标准差预定倍数(如3倍等)，则可以将该余项值作为异常点。

由于各行为的突变点有可能是待预测对象产生变动行为发生观念的时间点，因此，各行为的突变点距离当前时间的时间间隔有可能是待预测对象产生变动行为发生观念的时长。由于待预测对象的各行为的异常点数量可以在一定程度上反映出待预测对象的行为波动，而行为往往与观念具有较为紧密的联系，因此，各行为的异常点数量可以在一定程度上反映出待预测对象的变动行为发生观念的波动情况。由此可知，本公开通过在预测待预测对象的变动行为发生概率的过程中，对各行为的突变点距离当前时间的时间间隔和各行为的异常点数量进行考量，可以更全面的考虑待预测对象的行为特点，从而有利于提高变动行为发生概率预测的准确性。

在一个可选示例中，本公开中的待预测对象在未来预定时间段内各行为的未来预计量可以包括：各行为分别在未来预定时间段内的行为量范围、以及各行为分别在未来预定时间段内的预定行为量。即针对待预测对象的任一行为而言，本公开可以根据该行为的历史统计量(如基于单位时长的历史统计量)，预测该行为在未来预定时间段内的行为量范围、以及该行为在未来预定时间段内的预定行为量。其中的未来预定时间段可以为未来一周或者未来N天或者未来一个月等。

可选的，对于产生商机的行为而言，行为在未来预定时间段内的行为量范围可以为：在未来预定时间段内(如未来一周之内等)，所产生的商机量最有可能所属的数值区间范围；行为在未来预定时间段内的预定行为量可以为：在未来预定时间段内(如未来一周之内等)，所产生的商机量最有可能的具体数值。

可选的，对于带客户看房屋的行为而言，行为在未来预定时间段内的行为量范围可以为：在未来预定时间段内(如未来一周之内等)，带看量最有可能所属的数值区间范围；行为在未来预定时间段内的预定行为量可以为：在未来预定时间段内(如未来一周之内等)，带看量最有可能的具体数值。

可选的，对于被委托行为而言，行为在未来预定时间段内的行为量范围可以为：在未来预定时间段内(如未来一周之内等)，委托量最有可能所属的数值区间范围；行为在未来预定时间段内的预定行为量可以为：在未来预定时间段内(如未来一周之内等)，委托量最有可能的具体数值。

由于各行为分别在未来预定时间段内的行为量范围可以反映出待预测对象在未来预定时间段内的行为量的波动性，即待预测对象在未来预定时间段内的行为的不确定性；且各行为分别在未来预定时间段内的预定行为量可以反映出待预测对象在未来预定时间段内的各行为的发展趋势，因此，通过在预测待预测对象的变动行为发生概率的过程中，对各行为分别在未来预定时间段内的行为量范围以及各行为分别在未来预定时间段内的预定行为量进行考量，可以更全面的考虑待预测对象的行为特点，有利于提高变动行为发生概率预测的准确性。

在一个可选示例中，本公开可以利用预先设置的模型，预测待预测对象在未来预定时间段内各行为的未来预计量。具体的，本公开预先为待预测对象的每一种行为分别设置一个ARIMA(Autoregressive Integrated Moving Average，差分整合移动平均自回归)模型，针对待预测对象的任一行为而言，本公开可以将待预测对象的该行为的历史统计量(如基于单位时长的历史统计量)，作为模型输入提供给该行为对应的ARIMA模型，以经由该行为对应的ARIMA模型进行预测处理，本公开可以根据该ARIMA模型的输出，获得该行为在未来预定时间段内的行为量范围以及该行为在未来预定时间段内的预定行为量。

可选的，本公开中的各ARIMA模型均是通过对多个训练样本进行定阶处理而建立的。例如，对于任一行为而言，本公开可以通过对多个对象的该行为的历史统计量(如基于单位时长的历史统计量)进行定阶处理，从而形成该行为对应的ARIMA模型。具体的定阶处理过程在此不再详细说明。本公开通过利用不同行为各自对应的ARIMA模型可以便捷的获得各行为分别在未来预定时间段内的行为量范围以及各行为分别在未来预定时间段内的预定行为量。

在一个可选示例中，本公开中的预测模型可以为基于XGboost的模型，也可以为其他形式的模型，例如，神经网络模型等。该神经网络模型可以包括：输入层、多层全连接隐层(如5层全连接隐层等)以及输出层，该输出层通常是指用于实现分类的层，例如，该输出层可以为softmax层等。

可选的，本公开在利用预先设置的预测模型获得了待预测对象的变动行为发生概率之后，还可以对该变动行为发生概率进行修正，以保证最终获得的变动行为发生概率的准确性。一个具体的例子如图7所示。

S700、至少将待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，作为模型输入，提供给预测模型。

可选的，本公开不仅可以将待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，作为模型输入，还可以将其他信息与待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量一起，作为模型输入。例如，本公开可以将待预测对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量以及各行为的突变点距离当前时间的时间间隔一起，作为模型输入。再例如，本公开可以将待预测对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量以及各行为的异常点数量一起，作为模型输入。再例如，本公开可以将待预测对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量、各行为的突变点距离当前时间的时间间隔以及各行为的异常点数量一起，作为模型输入。

S701、确定预测模型输出的概率值所属的区间。

可选的，预测模型针对每一个模型输入，输出一个概率值，该概率值即为预测模型预测出的待预测对象的变动行为发生概率。本公开可以预先将概率值的取值范围(如0-1)划分为多个区间，例如，本公开可以将0-1划分为10个区间，分别为[0-0.1)、[0.1-0.2)、……[09-1]，从而本公开可以根据预先设置的所有区间，确定出预测模型输出的概率值所属的区间。

S702、根据区间对应的调整系数，对概率值进行调整，获得待预测对象的变动行为发生概率。

可选的，本公开可以预先为每一个区间设置一个调整系数，该调整系数可以是基于后验的调整系数。即本公开可以将实际的多个个体对象的变动行为发生情况与预测模型针对这多个个体对象预测出的变动行为发生概率进行对比，并根据对比结果为每个区间设置相应的调整系数。例如，假设经由预测模型预测出的多个个体对象的变动行为发生概率属于0.1-0.2，而在实际应用中，这多个个体对象的变动行为发生概率为0.3，那么本公开针对0.1-0.2这一区间，设置的调整系数可以为：0.3/[(0.1+0.2)/2]＝2。在针对0.1-0.2这一区间，设置的调整系数为2的情况下，如果预测模型预测出的待预测对象的变动行为发生概率为0.11，则由于0.11属于区间[0.1-0.2)，而区间[0.1-0.2)对应的调整系数为2，因此，本公开最终获得的待预测对象的变动行为发生概率为0.22。

本公开通过利用基于后验的调整系数对预测模型输出的概率值进行调整，有利于提高最终获得的待预测对象的变动行为发生概率的准确性。

在一个可选示例中，本公开利用预先准备好的训练集中的训练样本，对预测模型进行训练的一个过程如图8所示。

图8中，S800、将训练集中的多个训练样本分别作为模型输入，提供给待训练预测模型。

可选的，本公开可以将训练集中的每一个训练样本中的个体对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量、各行为的突变点距离当前时间的时间间隔以及各行为的异常点数量，分别提供给待训练预测模型。例如，本公开可以根据预设批处理数量从训练集中分别随机选取相同数量的正样本和负样本，并将每一个正样本和负样本中的个体对象的状态特征、各行为的历史统计量、各行为的时序特征、各行为的未来预计量、各行为的突变点距离当前时间的时间间隔以及各行为的异常点数量分别作为预测模型的模型输入，提供给待训练预测模型。本公开中的正样本可以是指具有表征个体对象已变动行为发生的第一标签(如1)的训练样本。本公开中的负样本可以是指具有表征个体对象未变动行为发生的第二标签(如0)的训练样本。

可选的，本公开可以根据预先设置的模型输入的格式，使训练样本中的各字段形成模型输入。例如，本公开可以对训练样本中的相应字段进行归一化或者类型转换或者映射等处理，使训练样本中的所有字段均满足待训练预测模型的输入要求。

S801、经由待训练预测模型根据模型输入，对每一个训练样本进行变动行为发生概率预测处理，获得每一个训练样本的变动行为发生概率。

可选的，待训练预测模型会针对每一个模型输入，分别形成一个概率值，该概率值可以表征出模型输入对应的个体对象在未来预定时间间隔内(如未来一个月内)变动行为发生的可能性。

S802、根据各训练样本中的标签以及待训练预测模型输出的相应概率值，调整预测模型的模型参数。

可选的，本公开可以根据预先设置的损失函数对待训练预测模型输出的各概率值和相应训练样本中的标签进行损失计算，并将损失计算的结果在该待训练预测模型中进行传播，以调整该待训练预测模型的模型参数。在待训练预测模型为基于XGboost的模型时，待训练预测模型的模型参数可以包括二叉树的结构参数等。在待训练预测模型为神经网络模型时，待训练预测模型的模型参数可以包括权值矩阵等。

可选的，在针对该待训练预测模型的训练达到预定迭代条件时，本次针对该待训练预测模型的训练过程结束。

可选的，本公开中的预定迭代条件可以包括：根据待训练预测模型针对测试集中的测试样本输出获得的预测结果的准确性达到预定要求。在待训练预测模型针对测试集中的测试样本的输出获得的预测结果的准确性达到预定要求的情况下，本次对该待训练预测模型成功训练完成。本公开中的预定迭代条件还可以包括：对一待训练预测模型进行训练，所使用的训练集中的训练样本的数量已经达到预定数量要求等。在使用的训练样本的数量达到预定数量要求，然而，在该预测模型针对测试集中的测试样本的输出获得的预测结果的准确性并未达到预定要求的情况下，本次对该待训练预测模型并未训练成功。成功训练完成的预测模型可以用于预测上述实施例中的待预测对象的变动行为发生概率。

本公开通过利用包含有个体对象的各行为的时序特征的训练样本对预测模型进行训练，尤其是利用包括有每一个个体对象的各行为的基于单调区间斜率的第一特征、各行为的基于正弦波的第二特征、各行为的用于表征待预测对象不稳定性的第三特征以及各行为的未来预计量的训练样本对预测模型进行训练，不仅可以使预测模型可以学习到个体对象的行为发展趋势，而且可以使预测模型学习到基于行业周期性的个体对象的行为发展趋势。通过利用包含有个体对象的各行为的突变点距离当前时间的时间间隔以及各行为的异常点数量的训练样本对待训练预测模型进行训练，使预测模型可以学习到产生变动行为发生观念的个体对象的行为突变情况。从而有利于使成功训练后的预测模型能够准确的预测变动行为发生概率。

示例性装置

图9为本公开的预测变动行为发生概率的装置一个实施例的结构示意图。该实施例的装置可用于实现本公开上述各方法实施例。

如图9所示，本实施例的装置主要包括：第一获取模块900、第二获取模块901、第一预测模块902以及第二预测模块903。可选的，该实施例的装置还可以包括：第三获取模块904和第四获取模块905中的至少一个。另外，本公开还可以包括：训练模块(图9中未示出)。训练模块用于训练本公开所需的模型。训练模块执行的操作可以参见上述实施例中有关图8的描述。

第一获取模块900用于获取待预测对象的状态特征以及所述待预测对象的至少一行为的历史统计量。

第二获取模块901用于根据各行为的历史统计量，获取各行为的时序特征。

可选的，第二获取模块901可以包括：第一子模块9011、第二子模块9012、第三子模块9013以及第四子模块9014。其中的第一子模块9011用于根据各行为的历史统计量中的基于单位时长的历史统计量进行时序分解，获得各行为的趋势分量、各行为的周期分量以及各行为的余项分量。其中的第二子模块9012用于根据各行为的趋势分量，分别获取各行为的基于单调区间斜率的第一特征。具体的，针对待预测对象的任一行为，第二子模块9012可以获取该行为的趋势分量形成的最后一个单调区间的斜率，并根据斜率以及待预测对象所属群体的斜率均值，确定该行为的第一特征。其中的第三子模块9013用于根据各行为的周期分量，分别获取各行为的基于正弦波的第二特征。具体的，针对待预测对象的任一行为，第三子模块9013可以根据该行为的周期分量，获取该行为的正弦波拟合参数，并根据正弦波拟合参数，确定相邻正弦波顶点间的距离，之后，第三子模块9013根据该距离及待预测对象所属群体的相邻正弦波顶点间的距离均值，确定该行为的第二特征。其中的第四子模块9014用于根据各行为的余项分量，分别获取各行为的用于表征待预测对象不稳定性的第三特征。具体的，针对待预测对象的任一行为，第四子模块9014可以根据该行为的余项分量，获取该行为的变异系数，并根据该变异系数以及待预测对象所属群体的变异系数均值，确定该行为的第三特征。

第一预测模块902用于根据各行为的历史统计量，预测待预测对象在未来预定时间段内各行为的未来预计量。

可选的，第一预测模块902可以包括：第五子模块9021。针对待预测对象的任一行为，第五子模块9021可以根据该行为的历史统计量，预测该行为在未来预定时间段内的行为量范围以及该行为在未来预定时间段内的预定行为量。具体的，针对待预测对象的任一行为，第五子模块9021可以将该行为的历史统计量中的基于单位时长的历史统计量，作为模型输入提供给该行为对应的差分整合移动平均自回归ARIMA模型，之后，第五子模块9021可以根据该行为对应的ARIMA模型的输出，获得该行为在未来预定时间段内的行为量范围、以及该行为在未来预定时间段内的预定行为量。

第二预测模块903用于根据状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测待预测对象的变动行为发生概率。

可选的，第二预测模块903可以包括：第六子模块9031、第七子模块9032以及第八子模块9033。其中的第六子模块9031用于至少将状态特征、各行为的历史统计量中的基于历史时长的历史统计量、各行为的时序特征以及各行为的未来预计量，作为模型输入，提供给预测模型。其中的第七子模块9032用于确定预测模型输出的概率值所属的区间。其中的第八子模块9033用于根据区间对应的调整系数，对概率值进行调整，获得待预测对象的变动行为发生概率。本公开中的历史时长包括多个单位时长，本公开中的调整系数为基于后验的调整系数。

第三获取模块904用于根据待预测对象的各行为的趋势分量，获取各行为的突变点距离当前时间的时间间隔。其中的突变点可以为：距离最后一个单调区间最近，且对应时长超过预定时长的单调区间的起点。本公开中的待预测对象的各行为的时间间隔可以与待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量一起，预测待预测对象的变动行为发生概率。

第四获取模块905用于根据待预测对象的各行为的余项分量，获取各行为的异常点数量。其中的异常点可以为：超过余项分量的标准差预定倍数的点。本公开中的待预测对象的各行为的时间间隔和/或各行为的异常点数量可以与待预测对象的状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量一起，预测待预测对象的变动行为发生概率。

上述各模块及其包括的子模块具体执行的操作可以参见上述方法实施例中针对图1-图7的描述，在此不再详细说明。

示例性电子设备

下面参考图10来描述根据本公开实施例的电子设备。图10示出了根据本公开实施例的电子设备的框图。如图10所示，电子设备101包括一个或多个处理器1011和存储器1012。

处理器1011可以是中央处理单元(CPU)或者具有预测变动行为发生概率的能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备101中的其他组件以执行期望的功能。

存储器1012可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器，例如，可以包括：随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器，例如，可以包括：只读存储器(ROM)、硬盘以及闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器1011可以运行所述程序指令，以实现上文所述的本公开的各个实施例的预测变动行为发生概率的方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中，电子设备101还可以包括：输入装置1013以及输出装置1014等，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外，该输入设备1013还可以包括例如键盘、鼠标等等。该输出装置1014可以向外部输出各种信息。该输出设备1014可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图10中仅示出了该电子设备101中与本公开有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备101还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本公开的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的预测变动行为发生概率的方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的预测变动行为发生概率的方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列举)可以包括：具有一个或者多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势以及效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是，在本公开的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述，以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言，是非常显而易见的，并且在此定义的一般原理可以应用于其他方面，而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种预测变动行为发生概率的方法，包括：

获取待预测对象的状态特征以及所述待预测对象的至少一行为的历史统计量；

根据各行为的历史统计量，获取各行为的时序特征；

根据各行为的历史统计量，预测所述待预测对象在未来预定时间段内各行为的未来预计量；

根据所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测所述待预测对象的变动行为发生概率。

2.根据权利要求1所述的方法，其中，所述根据各行为的历史统计量，获取各行为的时序特征，包括：

根据各行为的历史统计量中的基于单位时长的历史统计量进行时序分解，获得各行为的趋势分量、各行为的周期分量以及各行为的余项分量；

根据所述各行为的趋势分量，分别获取各行为的基于单调区间斜率的第一特征；

根据所述各行为的周期分量，分别获取各行为的基于正弦波的第二特征；

根据所述各行为的余项分量，分别获取各行为的用于表征所述待预测对象不稳定性的第三特征。

3.根据权利要求2所述的方法，其中，所述根据所述各行为的趋势分量，获取各行为的基于单调区间斜率的第一特征，包括：

针对所述待预测对象的任一行为，获取该行为的趋势分量形成的最后一个单调区间的斜率；

根据所述斜率以及所述待预测对象所属群体的斜率均值，确定该行为的第一特征。

4.根据权利要求2或3所述的方法，其中，所述根据所述各行为的周期分量，获取各行为的基于正弦波的第二特征，包括：

针对所述待预测对象的任一行为，根据该行为的周期分量，获取该行为的正弦波拟合参数；

根据所述正弦波拟合参数，确定相邻正弦波顶点间的距离；

根据所述距离以及所述待预测对象所属群体的相邻正弦波顶点间的距离均值，确定该行为的第二特征。

5.根据权利要求2至4中任一项所述的方法，其中，所述根据所述各行为的余项分量，获取各行为的用于表征所述待预测对象不稳定性的第三特征，包括：

针对所述待预测对象的任一行为，根据该行为的余项分量，获取该行为的变异系数；

根据所述变异系数以及所述待预测对象所属群体的变异系数均值，确定该行为的第三特征。

6.根据权利要求2至5中任一项所述的方法，其中，所述方法还包括：

根据所述各行为的趋势分量，获取各行为的突变点距离当前时间的时间间隔；其中，所述突变点为：距离最后一个单调区间最近，且对应时长超过预定时长的单调区间的起点；和/或

根据所述各行为的余项分量，获取各行为的异常点数量；其中，所述异常点为：超过余项分量的标准差预定倍数的点；

其中，所述各行为的时间间隔和/或各行为的异常点数量用于：与所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量一起，预测所述待预测对象的变动行为发生概率。

7.根据权利要求1至6中任一项所述的方法，其中，所述根据各行为的历史统计量，预测所述待预测对象在未来预定时间段内各行为的未来预计量，包括：

针对所述待预测对象的任一行为，根据该行为的历史统计量，预测该行为在未来预定时间段内的行为量范围以及该行为在未来预定时间段内的预定行为量。

8.一种预测变动行为发生概率的装置，其中，所述装置包括：

第一获取模块，用于获取待预测对象的状态特征以及所述待预测对象的至少一行为的历史统计量；

第二获取模块，用于根据各行为的历史统计量，获取各行为的时序特征；

第一预测模块，用于根据各行为的历史统计量，预测所述待预测对象在未来预定时间段内各行为的未来预计量；

第二预测模块，用于根据所述状态特征、各行为的历史统计量、各行为的时序特征以及各行为的未来预计量，预测所述待预测对象的变动行为发生概率。

9.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1-7中任一项所述的方法。

10.一种电子设备，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求1-7中任一项所述的方法。