CN112418559B

CN112418559B - 一种用户选择行为预测方法及装置

Info

Publication number: CN112418559B
Application number: CN202011451953.1A
Authority: CN
Inventors: 刘震; 王闯; 周兴; 李数
Original assignee: Guizhou Youce Network Technology Co ltd
Current assignee: Guizhou Youce Network Technology Co ltd
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2024-05-07
Anticipated expiration: 2040-12-09
Also published as: CN112418559A

Abstract

本发明提供了一种用户选择行为预测方法及装置，其中，该方法包括：获取影响目标用户选择行为的第一特征数据和第二特征数据；根据第一特征数据和预设神经网络模型获取表征目标用户选择行为的第一预测结果；对第二特征数据进行特征分析得到表征目标用户选择行为的第二预测结果；根据第一权值、第二权值及第一预测结果、第二预测结果确定目标用户选择行为的预测结果。预设神经网络模型可以对更多维度的数据进行分析，从而得到更准确的预测结果，传统的分析方法在任何情况下通过第二特征分析得到的第二预测结果都是符合实际应用情况的。本发明可以实现对预设神经网络模型和传统分析方法的互补，从而得到准确率更高的预测结果。

Description

一种用户选择行为预测方法及装置

技术领域

本发明涉及信息处理技术领域，具体涉及一种用户选择行为预测方法及装置。

背景技术

航空旅客选择行为是一种用户对航空服务的消费和购买决策，分析用户选择行为的结构特征及趋势，对用户选择行为进行准确预测有助于航空公司进一步了解用户需求，提高航空公司自身的竞争力，实现发展目标。

现有技术中，为了对用户选择行为进行预测，通常会根据不同情境下用户的选择行为训练神经网络模型，通过训练好的神经网络模型对用户的选择行为进行预测。但是影响用户选择行为的因素较多，由于训练时采集的训练数据有限，可能无法兼顾各种实际情况，容易导致训练得到的神经网络模型中的参数选取不合理，使用训练后的神经网络模型对用户选择行为进行预测时，会因为输入的数据与训练时采用的数据差别较大导致神经网络模型输出完全不符合逻辑的结果。

发明内容

因此，本发明要解决的技术问题在于克服现有技术中的使用神经网络模型对用户选择行为进行预测时，会因为输入的数据与训练时采用的数据差别较大导致神经网络模型输出完全不符合逻辑的结果的缺陷，从而提供一种用户选择行为预测方法及装置。

本发明第一方面提供了一种用户选择行为预测方法，包括如下步骤：获取影响目标用户选择行为的第一特征数据和第二特征数据，第一特征数据表征特征的维度大于或等于第二特征数据；根据第一特征数据和预设神经网络模型获取表征目标用户选择行为的第一预测结果；对所述第二特征数据进行特征分析得到表征目标用户选择行为的第二预测结果；根据第一权值、第二权值及所述第一预测结果、第二预测结果确定目标用户选择行为的预测结果。

可选地，在本发明提供的用户选择行为预测方法中，根据第一预测结果、第二预测结果、第一权值、第二权值确定目标用户选择行为的预测结果的步骤，包括：若所述第一预测结果和所述第二预测结果位于预设范围内，根据位于预设范围内的第一预测结果、第二预测结果，以及第一权值、第二权值确定目标用户选择行为的预测结果。

可选地，在本发明提供的用户选择行为预测方法中，根据第一预测结果、第二预测结果、第一权值、第二权值确定所述目标用户选择行为的预测结果的步骤，还包括：若第一预测结果和/或第二预测结果位于预设范围外，对第一预测结果和/或第二预测结果进行数据裁剪处理，使第一预测结果和第二预测结果位于预设范围内；并，执行根据位于所述预设范围内的第一预测结果、第二预测结果，以及第一权值、第二权值确定所述目标用户选择行为的预测结果的步骤。

可选地，在本发明提供的用户选择行为预测方法中，根据第一特征数据和预设神经网络模型获取第一预测结果的步骤，包括：从备选神经网络模型集群中随机选取其中一个备选神经网络模型作为预设神经网络模型；根据特征和预设神经网络模型获取第一预测结果。

可选地，在本发明提供的用户选择行为预测方法中，通过如下步骤构建备选神经网络模型集群：获取训练数据及验证数据；根据训练数据分别对多个初始模型进行训练，得到多个神经网络模型；根据验证数据对各神经网络模型进行验证，得到各神经网络模型的损失值；根据各神经网络模型的损失值选取至少一个神经网络模型构成备选神经网络模型集群。

可选地，在本发明提供的用户选择行为预测方法中，训练数据中包括训练特征数据和与各训练特征数据相对应的实际选择结果，通过如下步骤对初始模型进行训练，得到神经网络模型：将训练特征数据输入初始模型，得到预测结果；根据预测结果和实际选择结果计算初始模型的均方误差；若均方误差大于预设阈值，根据均方误差更新初始模型，利用更新后的模型代替初始模型，并返回执行将训练特征数据输入初始模型，得到预测结果步骤至若均方误差大于预设阈值，根据均方误差更新所述初始模型，利用更新后的模型代替初始模型的步骤，直至均方误差小于或等于预设阈值，将均方误差小于或等于预设阈值时对应的模型作为神经网络模型。

可选地，在本发明提供的用户选择行为预测方法中，还包括：根据训练数据和第一特征数据之间的分布差距确定第一权值和第二权值的值。

本发明第二方面提供了一种用户选择行为预测装置，包括：数据采集模块，用于获取影响目标用户选择行为的第一特征数据和第二特征数据，第一特征数据表征特征的维度大于或等于第二特征数据；第一预测结果获取模块，用于根据第一特征数据和预设神经网络模型获取表征目标用户选择行为的第一预测结果；第二预测结果获取模块，用于对所述第二特征数据进行特征分析得到表征目标用户选择行为的第二预测结果；预测结果确定模块，用于根据第一权值、第二权值及所述第一预测结果、第二预测结果确定目标用户选择行为的预测结果。

本发明第三方面提供了一种计算机设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，从而执行如本发明第一方面提供的用户选择行为预测方法。

本发明第四方面提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机指令，计算机指令用于使计算机执行如本发明第一方面提供的用户选择行为预测方法。

本发明技术方案，具有如下优点：

1.本发明提供的用户选择行为预测方法，在对目标用户的选择行为进行预测时，先获取影响目标用户选择行为的第一特征数据和第二特征数据，然后根据第一特征数据和预设神经网络模型获取第一预测结果，对第二特征数据进行特征分析得到第二预测结果，最后根据第一预测结果、第二预测结果，以及与第一预测结果和第二预测结果分别对应的第一权值、第二权值确定最终的预测结果。本发明中在对用户选择行为进行预测时，结合了通过预设神经网络模型获取的第一预测结果和通过传统分析方法得到的第二预测结果，预设神经网络模型在对用户的选择行为进行预测时所采用的第一特征数据可以融合更多维度的数据，更多维度的数据有助于得到更准确的预测结果，但是预设神经网络模型中的参数是随机选取的，因此当获取的第一特征数据与构建预设神经网络模型时使用的训练数据的差异较大时，容易得到完全不符合逻辑的结果；通过传统的分析方法对第二特征数据进行特征分析时，难以同时对多维度的特征数据进行分析，但是传统的分析方法是基于一定的理论基础对第二特征进行分析的，因此在任何情况下通过第二特征分析得到的第二预测结果都是符合实际应用情况的。由此可见，通过实施本发明对用户的选择行为进行预测时，可以实现对预设神经网络模型和传统分析方法的互补，从而得到准确率更高的预测结果。

2.本发明提供的用户选择行为预测方法，在根据第一预测结果、第二预测结果、第一权值、第二权值确定目标用户选择行为的预测结果时，若第一预测结果和/或第二预测结果位于预设范围外，则先对第一预测结果和/或第二预测结果进行数据裁剪处理，使得第一预测结果和第二预测结果位于预设范围内，然后根据位于预设范围内的第一预测结果、第二预测结果、第一权值、第二权值确定目标用户选择行为的预测结果，在第一预测结果和第二预测结果位于预设范围内的前提下，能够更容易地选取到使得预测结果更准确的第一权值和第二权值，因此，通过本发明提供的用户选择行为分析方法，能够更便捷地得到准确的预测结果。

3.本发明提供的用户选择行为预测方法，在根据预设神经网络模型获取第一预测结果时，先从备选神经网络模型集群中随机选取其中一个备选神经网络模型作为预设神经网络模型，然后根据选取的预设神经网络模型和特征数据确定第一预测结果，通过本发明提供的用户选择行为预测方法能够提高预设神经网络模型的泛化性，从而能够得到更准确的预测结果。

4.本发明提供的用户选择行为预测方法，第一权值和第二权值是根据训练数据和特征数据之间的分布差距确定的，因为导致预设神经网络模型得到的第一预测结果不准确的主要原因为特征数据与训练数据的差异较大，因此，根据特征数据和训练数据之间的分布差距确定的第一权值和第二权值能够使得预测结果更准确。

5.本发明提供的用户选择行为预测装置，在对目标用户的选择行为进行预测时，先获取影响目标用户选择行为的第一特征数据和第二特征数据，然后根据第一特征数据和预设神经网络模型获取第一预测结果，对第二特征数据进行特征分析得到第二预测结果，最后根据第一预测结果、第二预测结果，以及与第一预测结果和第二预测结果分别对应的第一权值、第二权值确定最终的预测结果。本发明中在对用户选择行为进行预测时，结合了通过预设神经网络模型获取的第一预测结果和通过传统分析方法得到的第二预测结果，预设神经网络模型在对用户的选择行为进行预测时所采用的第一特征数据可以融合更多维度的数据，更多维度的数据有助于得到更准确的预测结果，但是预设神经网络模型中的参数是随机选取的，因此当获取的第一特征数据与构建预设神经网络模型时使用的训练数据的差异较大时，容易得到完全不符合逻辑的结果；通过传统的分析方法对第二特征数据进行分析时，难以同时对多维度的特征数据进行分析，但是传统的分析方法是基于一定的理论基础对第二特征进行分析的，因此在任何情况下通过第二特征分析得到的第二预测结果都是符合实际应用情况的。由此可见，通过实施本发明对用户的选择行为进行预测时，可以实现对预设神经网络模型和传统分析方法的互补，从而得到准确率更高的预测结果。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1-图3为本发明实施例中用户选择行为预测方法的具体示例的流程图；

图4为本发明实施例中对初始模型进行训练得到神经网络模型的一个具体示例的流程图；

图5为本发明实施例中进行归一化处理后的模拟数据的具体示例；

图6为本发明实施例中验证方案一中通过预设神经网络模型得到的验证结果的准确率；

图7为本发明实施例中验证方案一中通过本发明实施例中提供的用户选择行为预测方法得到的验证结果的准确率；

图8为本发明实施例中验证方案二中通过预设神经网络模型得到的验证结果的准确率；

图9为本发明实施例中验证方案二中通过本发明实施例中提供的用户选择行为预测方法得到的验证结果的准确率；

图10为本发明实施例中用户选择行为预测装置的一个具体示例的原理框图；

图11为本发明实施例中提供的计算机设备的一个具体示例的原理框图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

本发明实施例提供了一种用户选择行为预测方法，如图1所示，包括如下步骤：

步骤S10：获取影响目标用户选择行为的第一特征数据和第二特征数据，第一特征数据表征特征的维度大于或等于第二特征数据，影响目标用户选择行为的第一特征数据和第二特征数据至少包括各候选对象的特征。第一特征数据和第二特征数据可以相同，也可以不同，但是为了突出预设神经网络模型的优势，可以选取更多维度的特征数据作为第一特征数据，而传统的分析算法难以同时对较多维度的数据进行分析，因此第二特征数据可以选取较少维度的数据。

在具体实施例中，在不同的场景中，影响用户选择行为的特征数据也不同，例如，当本发明实施例提供的用户选择行为预测方法应用于预测目标用户对航班的选择时，如下表1所示，影响目标对象选择行为的第一特征数据和第二特征数据至少包括：各航班中各舱的销售量、各航班的剩余座位数、航班距离起飞时间、各航班中各舱的价位、各航班的开舱情况，在下表1中，A1表示第一航班，A2表示第二航班。

表1

步骤S20：根据第一特征数据和预设神经网络模型获取表征目标用户选择行为的第一预测结果。

当本发明实施例提供的用户选择行为预测方法应用于预测目标对象对航班的选择时，经研究表明，各航班的开舱情况是影响目标对象选择结果的一项重要因素，并且，各航班在开舱时具有一定的策略，因此各航班的开舱情况是动态的，预设神经网络模型需要学习开舱情况的动态特性，才能对目标对象的选择行为进行准确分析预测，但是大多数神经网络无法学习这种动态特性，在传统的神经网络中，对神经网络进行训练时，会得到神经网络中参数的确定的数值，本发明实施例中所采用的预设神经网络模型是通过对贝叶斯神经网络训练得到的，在对贝叶斯神经网络进行训练时，得到的是贝叶斯神经网络中各参数的分布，各参数的分布可以是各参数的均值和方差，在将第一特征数据输入至训练后的贝叶斯神经网络中后，从各参数的均值和方差的高斯分布中采样得到各参数的具体值，然后通过采样得到的参数的具体值计算得到第一预测结果，由此可见，通过贝叶斯神经网络对用户选择行为进行预测时，参数的确定具有不确定性，不仅可以有效解决过拟合的问题，即使训练数据中出现的第一特征数据所属的状态的种类不多，仍然能够达到训练数据覆盖所有可能发生的状态时的学习效果，而且，由于贝叶斯神经网络的参数的确定具有不确定性，因此可以将影响用户选择的动态的特征融入其中，从而通过较少的数据构建得到效果较好且融合有动态特征的用于预测用户选择行为的仿真环境。

步骤S30：对所述第二特征数据进行特征分析得到表征目标用户选择行为的第二预测结果。对第二特征数据进行特征分析时，可以通过线性回归模型或其他数学模型进行特征分析，也可以通过所属技术领域中的除通过神经网络模型分析之外的其他经典算法进行分析。

在具体实施例中，获取第二预测结果的过程不同于上述通过预设神经网络模型获取第一预测结果的过程，第二预测结果是在一定理论依据的基础上对第二特征数据进行分析得到的，示例性地，分析过程可以为，先对历史数据进行拟合分析得到线性回归模型，然后通过线性回归模型和第二特征数据分析得到第二预测数据，线性回归模型是根据真实的数据拟合得到的，不存在随机获取的参数，因此通过线性回归模型分析得到的第二预测结果具有一定的理论依据。

步骤S40：根据第一权值、第二权值及第一预测结果、第二预测结果确定目标用户选择行为的预测结果。在具体实施例中，第一权值对应第一预测结果，第二权值对应第二预测结果。

在具体实施例中，需要说明的是，若第二预测结果采用线性回归模型获取，将预设神经网络模型和线性回归模型结合对目标对象的选择行为进行预测，并不是通过神经网络线性回归模型对目标对象的选择行为进行预测，神经网络线性回归模型在训练过程中开销较大，并且不适用于本发明实施例中对目标用户的选择行为进行预测。

本发明实施例提供的用户选择行为预测方法，在对目标用户的选择行为进行预测时，先获取影响目标用户选择行为的第一特征数据和第二特征数据，然后根据第一特征数据和预设神经网络模型获取第一预测结果，对第二特征数据进行特征分析得到第二预测结果，最后根据第一预测结果、第二预测结果，以及与第一预测结果和第二预测结果分别对应的第一权值、第二权值确定最终的预测结果。本发明中在对用户选择行为进行预测时，结合了通过预设神经网络模型获取的第一预测结果和通过传统分析方法得到的第二预测结果，预设神经网络模型在对用户的选择行为进行预测时所采用的第一特征数据可以融合更多维度的数据，更多维度的数据有助于得到更准确的预测结果，但是预设神经网络模型中的参数是随机选取的，因此当获取的第一特征数据与构建预设神经网络模型时使用的训练数据的差异较大时，容易得到完全不符合逻辑的结果；通过传统的分析方法对第二特征数据进行分析时，难以同时对多维度的特征数据进行分析，但是传统的分析方法是基于一定的理论基础对第二特征进行分析的，因此在任何情况下通过第二特征分析得到的第二预测结果都是符合实际应用情况的。由此可见，通过实施本发明对用户的选择行为进行预测时，可以实现对预设神经网络模型和传统分析方法的互补，从而得到准确率更高的预测结果。

在一可选实施例中，如图2所示，在本发明实施例提供的用户选择行为预测方法中，上述步骤S40具体包括：

步骤41：判断第一预测结果和/或第二预测结果是否位于预设范围外，若第一预测结果和/或第二预测结果位于预设范围外，先执行步骤S42，然后执行步骤S43，若第一预测结果和第二预测结果都位于预设范围内，则直接执行步骤S43。

步骤42：对第一预测结果和/或第二预测结果进行数据裁剪处理，使第一预测结果和第二预测结果位于预设范围内。

在一具体实施例中，预设范围可以根据训练数据中各候选对象对应的取值范围确定，例如，当训练数据中，选择A1航班所对应的值小于0，选择A2航班所对应的值大于0，则可以将小于0的一个任意数和大于0的一个任意数构成的闭区间确定为预设范围，例如，预设范围可以为[-1，1],当第一预测结果或第二预测结果小于-1时，将第一预测结果或第二预测结果裁剪为-1，当第一预测结果或第二预测结果大于1时，将第一预测结果或第二预测结果裁剪为1。

步骤43：根据位于预设范围内的第一预测结果、第二预测结果，以及第一权值、第二权值确定所述目标用户选择行为的预测结果。

在一具体实施例中，当预测范围为[-1，1]，且-1表示第一航班，1表示第二航班时，若对第一预测结果和第二预测结果进行加权计算后，得到的值小于0，则表示预测结果为目标用户选择第一航班，若加权计算后得到的值大于0，则表示预测结果为目标用户选择第二航班。

本发明实施例提供的用户选择行为预测方法，在根据第一预测结果、第二预测结果、第一权值、第二权值确定目标用户选择行为的预测结果时，若第一预测结果和/或第二预测结果位于预设范围外，则先对第一预测结果和/或第二预测结果进行数据裁剪处理，使得第一预测结果和第二预测结果位于预设范围内，然后根据位于预设范围内的第一预测结果、第二预测结果、第一权值、第二权值确定目标用户选择行为的预测结果，在第一预测结果和第二预测结果位于预设范围内的前提下，能够更容易地选取到使得预测结果更准确的第一权值和第二权值，因此，通过本发明实施例提供的用户选择行为分析方法，能够更便捷地得到准确的预测结果。

在一可选实施例中，在本发明实施例提供的用户选择行为预测方法中，根据训练数据和第一特征数据之间的分布差距确定第一权值和第二权值的值。例如，当第一特征数据和训练数据之间的分布差距较大时，则可以适当减小与第一预测结果相对应的第一权值，加大对第二预测结果相对应的第二权值。

本发明实施例提供的用户选择行为预测方法，第一权值和第二权值是根据训练数据和第一特征数据之间的分布差距确定的，因为导致预设神经网络模型得到的第一预测结果不准确的主要原因为第一特征数据与训练数据的差异较大，因此根据第一特征数据和训练数据之间的分布差距确定的第一权值和第二权值能够使得预测结果更准确。

在一可选实施例中，如图3所示，在本发明实施例提供的用户选择行为预测方法中，上述步骤S20具体包括：

步骤S21：从备选神经网络模型集群中随机选取其中一个备选神经网络模型作为预设神经网络模型，备选神经网络模型集群中包括多个损失值较小的备选神经网络模型，在一具体实施例中，备选神经网络模型都是通过对贝叶斯神经网络训练得到的。

步骤S22：根据第一特征数据和预设神经网络模型获取第一预测结果。

在本发明实施例中，由多个损失值较小的备选神经网络模型构建备选神经网络模型集群，在对目标用户的选择行为进行预测时，从备选神经网络模型集群中随机选取其中一个备选神经网络模型作为预设神经网络，既保障了预设神经网络模型的精确度，也提高了预设神经网络模型的泛化性。

在本发明实施例提供的用户选择行为预测方法中，构建备选神经网络模型集群的步骤包括：

首先，获取训练数据及验证数据，训练数据和验证数据中都包含有影响目标用户选择模型的训练特征数据和目标用户的真实选择结果，训练数据和验证数据的数据格式如上表1所示。

然后，根据训练数据分别对多个初始模型进行训练，得到多个神经网络模型。

在本发明实施例中，初始模型为贝叶斯神经网络，对贝叶斯神经网络的训练是对贝叶斯神经网络中的权重ω₀及偏置b₀的分布进行训练，在一具体实施例中，对贝叶斯神经网络的权重ω₀及偏置b₀的分布进行训练，即根据训练数据确定贝叶斯神经网络的权重ω₀及偏置b₀的均值及方差。具体地，可以分别对num_networks＝6个贝叶斯神经网络进行训练，每个贝叶斯神经网络有N＝5个隐藏层，每层均有16个神经元，除最后一个隐藏层没有激活函数外，其余各个隐藏层的激活函数都为swish函数，各个隐藏层的权重衰减值分别为，weight_decay_1＝0.000025、weight_decay_2＝0.00005、weight_decay_3＝0.000075、weight_decay_4＝0.000075、weight_decay_5＝0.0001，优化函数采用Adam函数，学习率learning_rate＝0.001，贝叶斯神经网络输入为销售状态state和当前所处时间点两个民航公司的开舱动作action，输出为航空旅客选择行为select。

在一具体实施例中，还可以设定训练初始模型模型中的其他超参数：训练总回合数、每次随机选择的样本的个数m，存储真实数据的数据池列表的长度，训练集和验证集的比例等。

再次，根据验证数据对各神经网络模型进行验证，得到各神经网络模型的损失值。

最后，根据各神经网络模型的损失值选取至少一个神经网络模型构成备选神经网络模型集群。在本发明实施例中，可以选取训练得到的神经网络模型中损失值较小的几个神经网络模型构建神经网络模型集群。

在一可选实施例中，如图4所示，对初始模型进行训练，得到神经网络模型的步骤，具体包括：

步骤S51：将训练特征数据输入初始模型，得到预测结果。

步骤S52：根据预测结果和实际选择结果计算初始模型的均方误差。

步骤S53：判断预测结果和实际选择结果计算初始模型的均方误差是否大于预设阈值，若均方误差大于预设阈值，则执行步骤S54，根据均方误差更新初始模型，利用更新后的模型代替初始模型，并返回步骤S51，重复执行上述步骤S51-S53，直到均方误差小于或等于预设阈值，结束循环，将均方误差小于或等于预设阈值时对应的模型作为神经网络模型。

为了证明上述实施例中的用户选择行为预测方法可以得到准确率更高的预测结果，本发明实施例中对上述实施例提供的用户选择行为预测方法进行了验证。

为了验证上述用户选择行为预测方法的准确率，本发明实施例中需要先模拟一组数据，通过模拟数据对上述方法进行验证，生成模拟数据的步骤包括：

生成距离飞机起飞前0-30天范围内的机票销售过程数据，在此销售过程中有两架航班可供旅客选择，为了简化模型，两架航班的信息由以下简化特征构成：

A1航班：

总座位数：A1_capacity＝200

舱级：A1_cabin＝['Y','H','B','M','N']

各舱级价格：A1_fare＝[1000,900,800,700,600]

A2航班：

总座位数：A2_capacity＝300

舱级：A2_cabin＝['Y','H','B','M','N']

各舱级价格：A2_fare＝[950,850,750,650,550]

通过二项分布及泊松分布生成旅客到达数据，由于旅客对航班的选择是有一定规律的，在本发明实施例中，设计了旅客对航班选择的规律：在销售期前半段选择两个航班动态开舱中开的最低舱价格中价格低的那个航班的此舱位，在销售后半段反之选择价格高的，为了对旅客的选择行为进行准确预测，上述实施例提供的方法需要准确学习这一规律。

设定两个航班的开舱策略，为了大体符合实际开舱情况，按照距离起飞时间越近开的舱级越高的规则设定函数来生成开舱数据，A1函数：y1＝a*x1，过点(0,0)和点(744,4)；A2函数：y2＝b*x2，过点(0,0)和点(744,4)，x1和x2均在[0,744]范围内，y1和y2均在[0,4]范围内(744＝31天*24小时，[0,4]是指五个级别的舱对应的索引值0-4，根据A1、A2函数及均过点(0,0)和点(744,4)，可以求出a和b，那么随着销售时间x的变化就可以求出对应开舱等级的索引值y)。开舱方式为每次选择开的舱作为当前可售的最低等级舱，每次开5个舱，其余舱位放在最高等级舱，销售时按照嵌套原则，销售高等级舱可以占用低等级舱座位，为了对旅客的选择行为进行准确预测，上述实施例提供的方法需要准确学习A1航班和A2航班的开舱策略。模拟得到的数据按照上述表1中的格式进行存储。

具体地，在实际应用时，会将以上述格式存储的数据进行归一化处理，如图5所示的数据为归一化处理的举例说明。

在如图5所示的实施例中，开舱情况为1，则表示对应舱级开舱，且在本实施例中，假设旅客选择某个航班的舱级时默认选择当前开舱等级里价格最低的，因此设定select＝-1表示选择A1航班的最低价舱，select＝1表示选择A2航班的最低价舱。

在得到模拟数据后，设计了两个验证方案对执行上述实施例中提供的用户选择行为预测方法进行验证：

方案一：将模拟数据中的数据分为两部分，第一部分为用于训练预设神经网络模型和预设线性回归模型的旅客到达数据和开舱数据，另一部分为用于验证的旅客到达数据和开舱数据，在该方案中，用于训练预设神经网络模型和预设线性回归模型的旅客到达数据和开舱数据与用于验证的旅客到达数据和开舱数据不同，且用于验证的开舱数据在用于训练预设神经网络模型和预设线性回归模型的开舱数据的基础上随机浮动。通过预设神经网络模型基于用于验证的数据对旅客的选择行为进行预测，得到的预测结果的准确率如图6所示。通过上述实施例中的方法基于用于验证的数据对旅客的选择行为进行预测，在此次验证过程中，第一权值为0.4，第二权值为0.6，得到的预测结果的准确率如图7所示。

由图6所示的验证结果可知，通过预设神经网络模型得到的预测结果中，正确率最小值为0.81，正确率最大值为0.88，正确率平均值为0.84。由图7所示的验证结果可知，通过上述实施例提供的方法得到的预测结果中，正确率最小值为0.97，正确率最大值为0.99，正确率平均值为0.98。

方案二：将模拟数据中的数据分为两部分，第一部分为用于训练预设神经网络模型和预设线性回归模型的旅客到达数据和开舱数据，另一部分为用于验证的旅客到达数据和开舱数据，在该方案中，用于训练预设神经网络模型和预设线性回归模型的旅客到达数据和开舱数据与用于验证的旅客到达数据和开舱数据不同，且用于验证的开舱数据完全随机。通过预设神经网络模型基于用于验证的数据对旅客的选择行为进行预测，得到的预测结果的准确率如图8所示。通过上述实施例中的方法基于用于验证的数据对旅客的选择行为进行预测，在此次验证过程中，第一权值为0.1，第二权值为0.9，得到的预测结果的准确率如图9所示。

由图8所示的验证结果可知，通过预设神经网络模型得到的预测结果中，正确率最小值为0.65，正确率最大值为0.75，正确率平均值为0.69。由图9所示的验证结果可知，通过上述实施例提供的方法得到的预测结果中，正确率最小值为0.73，正确率最大值为0.82，正确率平均值为0.78。

由上述两个验证方案得到的验证结果可知，当实际应用中使用的数据与训练过程中使用的数据的分布有一定差距时，通过上述实施例提供的用户选择行为预测方法预测得到的预测结果的准确率更高，并且，实际应用中使用的数据分布与训练过程中使用的数据分布差距越大，应当为预设线性回归模型设置越大的权值。

本发明实施例提供了一种用户选择行为预测装置，如图10所示，包括：

数据采集模块10，用于获取影响目标用户选择行为的第一特征数据和第二特征数据，第一特征数据表征特征的维度大于或等于第二特征数据，详细内容参见上述任意方法实施例的步骤S10的相关描述，在此不再赘述。

第一预测结果获取模块20，用于根据第一特征数据和预设神经网络模型获取表征目标用户选择行为的第一预测结果，详细内容参见上述任意方法实施例的步骤S20的相关描述，在此不再赘述。

第二预测结果获取模块30，用于对所述第二特征数据进行特征分析得到表征目标用户选择行为的第二预测结果，详细内容参见上述任意方法实施例的步骤S30的相关描述，在此不再赘述。

预测结果确定模块40，用于根据第一权值、第二权值及第一预测结果、第二预测结果确定所述目标用户选择行为的预测结果，详细内容参见上述任意方法实施例的步骤S40的相关描述，在此不再赘述。

本发明实施例提供的用户选择行为预测装置，在对目标用户的选择行为进行预测时，先获取影响目标用户选择行为的第一特征数据和第二特征数据，然后根据第一特征数据和预设神经网络模型获取第一预测结果，对第二特征数据进行特征分析得到第二预测结果，最后根据第一预测结果、第二预测结果，以及与第一预测结果和第二预测结果分别对应的第一权值、第二权值确定最终的预测结果。本发明中在对用户选择行为进行预测时，结合了通过预设神经网络模型获取的第一预测结果和通过传统分析方法得到的第二预测结果，预设神经网络模型在对用户的选择行为进行预测时所采用的第一特征数据可以融合更多维度的数据，更多维度的数据有助于得到更准确的预测结果，但是预设神经网络模型中的参数是随机选取的，因此当获取的第一特征数据与构建预设神经网络模型时使用的训练数据的差异较大时，容易得到完全不符合逻辑的结果；通过传统的分析方法对第二特征数据进行分析时，难以同时对多维度的特征数据进行分析，但是传统的分析方法是基于一定的理论基础对第二特征进行分析的，因此在任何情况下通过第二特征分析得到的第二预测结果都是符合实际应用情况的。由此可见，通过实施本发明对用户的选择行为进行预测时，可以实现对预设神经网络模型和传统分析方法的互补，从而得到准确率更高的预测结果。

本发明实施例提供了一种计算机设备，如图11所示，该计算机设备主要包括一个或多个处理器51以及存储器52，图11中以一个处理器51为例。

该计算机设备还可以包括：输入装置53和输出装置54。

处理器51、存储器52、输入装置53和输出装置54可以通过总线或者其他方式连接，图11中以通过总线连接为例。

处理器51可以为中央处理器(Central Processing Unit，CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器52可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据用户选择行为预测装置的使用所创建的数据等。此外，存储器52可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器52可选包括相对于处理器51远程设置的存储器，这些远程存储器可以通过网络连接至用户选择行为预测装置。输入装置53可接收用户输入的计算请求(或其他数字或字符信息)，以及产生与用户选择行为预测装置有关的键信号输入。输出装置54可包括显示屏等显示设备，用以输出计算结果。

本发明实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储计算机指令，所述计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的用户选择行为预测方法。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(Random Access Memory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-StateDrive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种用户选择行为预测方法，其特征在于，包括如下步骤：

获取影响目标用户选择行为的第一特征数据和第二特征数据，所述第一特征数据表征特征的维度大于或等于所述第二特征数据，所述第一特征数据和第二特征数据至少包括：各航班中各舱的销售量、各航班的剩余座位数、航班距离起飞时间、各航班中各舱的价位、各航班的开舱情况，所述开舱情况是根据各航班的开舱策略确定的，开舱情况包括距离起飞时间与开舱的级别之间的对应关系；

根据所述第一特征数据和预设神经网络模型获取表征目标用户选择行为的第一预测结果，所述预设神经网络模型是通过对贝叶斯神经网络训练得到的，在对贝叶斯神经网络进行训练时，得到的是贝叶斯神经网络中各参数的分布，各参数的分布包括各参数的均值和方差，在将第一特征数据输入至训练后的贝叶斯神经网络中后，从各参数的均值和方差的高斯分布中采样得到各参数的具体值，然后通过采样得到的参数的具体值计算得到第一预测结果；

对所述第二特征数据通过线性回归模型进行特征分析得到表征目标用户选择行为的第二预测结果；

根据第一预设结果、第二预测结果，以及与第一预设结果、第二预测结果分别对应的第一权值、第二权值确定所述目标用户选择行为的预测结果。

2.根据权利要求1所述的用户选择行为预测方法，其特征在于，根据第一预设结果、第二预测结果，以及与第一预设结果、第二预测结果分别对应的第一权值、第二权值确定所述目标用户选择行为的预测结果的步骤，包括：

若所述第一预测结果和所述第二预测结果位于预设范围内，

根据位于所述预设范围内的第一预测结果、第二预测结果，以及第一权值、第二权值确定所述目标用户选择行为的预测结果。

3.根据权利要求2所述的用户选择行为预测方法，其特征在于，根据第一预设结果、第二预测结果，以及与第一预设结果、第二预测结果分别对应的第一权值、第二权值确定所述目标用户选择行为的预测结果，还包括：

若所述第一预测结果和/或所述第二预测结果位于预设范围外，

对所述第一预测结果和/或所述第二预测结果进行数据裁剪处理，使所述第一预测结果和所述第二预测结果位于所述预设范围内；并，执行根据位于所述预设范围内的第一预测结果、第二预测结果，以及第一权值、第二权值确定所述目标用户选择行为的预测结果的步骤。

4.根据权利要求1所述的用户选择行为预测方法，其特征在于，根据所述第一特征数据和预设神经网络模型获取第一预测结果的步骤，包括：

从备选神经网络模型集群中随机选取其中一个备选神经网络模型作为所述预设神经网络模型；

根据所述第一特征数据和所述预设神经网络模型获取所述第一预测结果。

5.根据权利要求4所述的用户选择行为预测方法，其特征在于，通过如下步骤构建所述备选神经网络模型集群：

获取训练数据及验证数据；

根据所述训练数据分别对多个初始模型进行训练，得到多个神经网络模型；

根据所述验证数据对各所述神经网络模型进行验证，得到各所述神经网络模型的损失值；

根据各神经网络模型的损失值选取至少一个所述神经网络模型构成所述备选神经网络模型集群。

6.根据权利要求5所述的用户选择行为预测方法，其特征在于，所述训练数据中包括训练特征数据和与各训练特征数据相对应的实际选择结果，通过如下步骤对所述初始模型进行训练，得到神经网络模型：

将所述训练特征数据输入所述初始模型，得到预测结果；

根据所述预测结果和所述实际选择结果计算所述初始模型的均方误差；

若所述均方误差大于预设阈值，根据所述均方误差更新所述初始模型，利用更新后的模型代替所述初始模型，迭代训练，直至所述均方误差小于或等于所述预设阈值时，将所述均方误差小于或等于所述预设阈值时对应的模型作为所述神经网络模型。

7.根据权利要求5所述的用户选择行为预测方法，其特征在于，还包括：

根据所述训练数据和所述第一特征数据之间的分布差距确定所述第一权值和所述第二权值的值。

8.一种用户选择行为预测装置，其特征在于，包括：

数据采集模块，用于获取影响目标用户选择行为的第一特征数据和第二特征数据，所述第一特征数据表征特征的维度大于或等于所述第二特征数据，所述第一特征数据和第二特征数据至少包括：各航班中各舱的销售量、各航班的剩余座位数、航班距离起飞时间、各航班中各舱的价位、各航班的开舱情况，所述开舱情况是根据各航班的开舱策略确定的，开舱情况包括距离起飞时间与开舱的级别之间的对应关系；

第一预测结果获取模块，用于根据所述第一特征数据和预设神经网络模型获取表征目标用户选择行为的第一预测结果，所述预设神经网络模型是通过对贝叶斯神经网络训练得到的，在对贝叶斯神经网络进行训练时，得到的是贝叶斯神经网络中各参数的分布，各参数的分布包括各参数的均值和方差，在将第一特征数据输入至训练后的贝叶斯神经网络中后，从各参数的均值和方差的高斯分布中采样得到各参数的具体值，然后通过采样得到的参数的具体值计算得到第一预测结果；

第二预测结果获取模块，用于对所述第二特征数据通过线性回归模型进行特征分析得到表征目标用户选择行为的第二预测结果；

预测结果确定模块，用于根据第一预设结果、第二预测结果，以及与第一预设结果、第二预测结果分别对应的第一权值、第二权值确定所述目标用户选择行为的预测结果。

9.一种计算机设备，其特征在于，包括：

至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，从而执行如权利要求1-7中任一项所述的用户选择行为预测方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行如权利要求1-7中任一项所述的用户选择行为预测方法。