CN108648020A

CN108648020A - 用户行为量化方法、系统、设备及存储介质

Info

Publication number: CN108648020A
Application number: CN201810461491.8A
Authority: CN
Inventors: 李腾龙; 霍文虎
Original assignee: Ctrip Travel Information Technology Shanghai Co Ltd
Current assignee: Ctrip Travel Information Technology Shanghai Co Ltd
Priority date: 2018-05-15
Filing date: 2018-05-15
Publication date: 2018-10-12

Abstract

本发明提供了用户行为量化的方法、系统、设备及存储介质，包括步骤：将订单涉及的所有动作按固定次序预先排列为一参考序列；采集用户订单下单前的操作的动作，按形成时序排列动作以形成动作序列；将动作序列转换为动作矩阵；构建循环神经网络模型，将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入循环神经网络模型进行训练；输出最后一层的隐藏层作为输出结果。本发明通过动作序列采集包括时序信息的动作，通过转换动作向量，以实现时序信息的初步数值化，通过构建以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现处理和预测时间序列数据，以应用于用户行为监督模型，有效提高预测准确性。

Description

用户行为量化方法、系统、设备及存储介质

技术领域

本发明涉及用户信用评估领域，具体地说，涉及用户行为量化方法、系统、设备及存储介质。

背景技术

随着大数据时代的到来，旅游行业日新月异，用户不仅可以“说走就走”，还有机会享受“免押金，免查房，离店后付款”的优质住宿体验，这在一定程度上取决于用户信用风险的高低。当一个用户享受信用产品后拒绝履约时，就会造成资金损失，所以做好风险的预估显得尤为重要。除了旅游行业，在其他多个行业也越来越多地涉及信用支付，因此准确的用户信用评估也日趋重要。

评估用户信用的纬度可以有很多，用户行为跟踪(User Behavior Tracking，UBT)也是其中的一种。UBT数据十分庞大复杂，基于互联网环境下，进行互联网订单的UBT数据分析，处理方式大多只能简单地统计用户的浏览次数，点击次数，浏览时长等。然而，UBT数据的发生次序也具有重要作用，例如一笔正常的订单，往往有着相对完整的行为路径：如先搜索酒店，再筛选，然后查看酒店详情，图片，往返多次后下单。现有技术没有考虑UBT数据的时间序列信息，更无法将带有时序信息的用户行为量化输入用户行为监督模型。

发明内容

针对上述技术中的问题，本发明为了解决上述技术问题，提供了一种用户行为量化的方法、系统、设备及存储介质，本发明的第一方面提供一种用户行为量化的方法，包括以下步骤：S10、将订单涉及的所有动作按固定次序预先排列为一参考序列；S11、采集用户订单下单前的操作的动作，按形成时序排列动作以形成动作序列；S12、将动作序列中的每一个动作匹配参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵；S13、构建循环神经网络模型，循环神经网络模型符合公式：

s_t＝f(U*x_t+W*s_t-1+b)

其中，f为激活函数，S_t以及S_t-1为构建循环神经网络的隐藏层，U，W为模型的参数矩阵，b为偏置项，x_t为步骤S12中的动作向量；S14、将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据，输入循环神经网络模型，以训练循环神经网络模型；S15、输出最后一层的隐藏层作为输出结果。

优选地，步骤S11包括：S111、采集用户订单下单前的所有动作，并按形成时序排列动作以形成动作序列；S113、保留下单前的t次动作，其中t为正整数。

优选地，在步骤S11中，在步骤S113前还包括步骤：S112、合并动作序列中相邻的重复动作。

优选地，在步骤S14的循环神经网络模型中构建损失函数loss，将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入循环神经网络模型进行迭代，最小化损失函数，以获得最优的U，W，b，损失函数loss符合以下公式：

其中，p_i为预测概率，y_i为与动作矩阵对应的订单的样本标签。

优选地，在步骤S14中，预测概率p_i符合下述公式：

p_i＝softmaz(w_out*s_t+b_out)

其中，w_out为模型的参数矩阵，b_out为偏置项，S_t为构建循环神经网络的隐藏层；将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入循环神经网络模型进行迭代，最小化损失函数，以获得最优的w_out以及b_out。

优选地，在步骤S13中，设定循环神经网络模型的隐含层节点数为q，第一个隐含层S0为任意q*1维向量。

优选地，还包括步骤：S16、将步骤S15中的输出结果作为输入数据，输入用户行为监督模型，以进行用户行为监督模型训练。

本发明的第二方面提供一种用户行为量化的系统，包括：动作采集模块，动作采集模块用于采集用户订单下单前的动作，按形成时序排列动作以形成动作序列；转换模块，转换模块用于将订单涉及的所有动作按固定次序预先排列为一参考序列，将动作序列中的每一个动作匹配参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵；模型构建模块，模型构建模块用于构建循环神经网络模型，循环神经网络模型符合公式：

s_t＝f(U*x_t+W*s_t-1+b)

其中，f为激活函数，S_t以及S_t-1为构建循环神经网络的隐藏层，U，W为模型的参数矩阵，b为偏置项，x_t为转换模块转换后的动作向量；模型训练模块，模型训练模块用于将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据，输入循环神经网络模型，以训练循环神经网络模型；输出模块，输出模块用于输出最后一层的隐藏层作为输出结果。

本发明的第三方面还提供一种用户行为量化设备，包括：处理器；存储器，其中存储有处理器的可执行指令；其中，处理器配置为经由执行可执行指令来执行上述第一方面的用户行为量化的方法的步骤。

本发明的第四方面还提供一种计算机可读存储介质，用于存储程序，程序被执行时实现上述第一方面的用户行为量化的方法的步骤。

本发明所提供的用户行为量化的方法、系统、设备及存储介质通过对于订单下单前动作的采集，按时序形成动作序列，从而获取UBT数据的时间序列信息。通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量，以将所述动作序列转换为动作矩阵，从而实现时序信息的初步数值化。通过构建循环神经网络模型以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现处理和预测时间序列数据，以使得提取后的时序数据能够被量化，以应用于用户行为监督模型。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显。

图1是本发明一实施例的用户行为量化的方法的流程图；

图2是图1中步骤S11的详细流程图；

图3是本发明一实施例的循环神经网络模型的示意图；

图4是本发明一实施例的包括用户行为量化的系统的模块示意图；

图5是本发明一实施例的用户行为量化的设备的结构示意图；以及

图6是本发明一实施例的计算机可读存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的实施方式。相反，提供这些实施方式使得本发明将全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构，因而将省略对它们的重复描述。

现有技术在进行互联网订单的UBT数据分析，处理方式大多只能简单地统计用户的浏览次数，点击次数，浏览时长等，而没有考虑UBT数据的时间序列信息。传统的监督模型大多只能够接受矩阵输入数据格式，而无法利用用户浏览数据中的“先后顺序”。无法有效地提取出UBT数据中隐藏的时间序列信息，并量化为传统模型训练可以接受的数据格式。

本发明采集订单下单前动作，按时序形成动作序列，通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量，以将所述动作序列转换为动作矩阵，通过构建循环神经网络模型以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现了时间序列信息的采集以及量化，使得时序信息能够被在监督模型中计算，从而有效地提高用户信用评估的准确性。

图1是本发明一实施例的用户行为量化的方法的流程图。如图1所示，本发明的用户行为量化的方法，包括以下步骤：

S10、将订单涉及的所有动作按固定次序预先排列为一参考序列。

预先定义用户进行互联网订单下单前的所有操作的动作。例如在酒店下单场景下，用户下单前的操作的动作包括浏览酒店列表页面，浏览酒店图片，浏览酒店评价，搜索酒店名称，筛选酒店评分等。

在本实施例中，设定相同操作所指向的不同对象为不同的操作的动作，从而保障动作划分较细，提高数据准确性。在其他实施例中，也可设定相同操作所指向的部分对象为相同的操作的动作。

将所有动作按固定次序预先排列为一参考序列，从而用于后续步骤中作为参照进行比对。例如构建参考序列[A,B,C,D,E,F,G,H,I,J,K]，其中每个字母代表不同的动作，A,B,C,D,E,F,G,H,I,J,K为订单涉及的所有动作。参考序列按固定顺序排列。

S11、采集用户订单下单前的操作的动作，按形成时序排列动作以形成动作序列。

采集用户进行互联网订单下单前的操作的动作，采集方式可以使用现有技术，例如通过网页脚本语言读取对网页内容以及操作的动作。

将采集的本次订单下单前的操作的动作，按动作形成的时序排列形成动作序列[a₁,a₂,…，a_i，a_i+1,…a_m]，每个a_i代表用户浏览中的一次动作，并且下标i的大小代表其浏览的先后顺序，m为动作序列包含的动作数量，m取正整数。a_i为S10中预定义的所有动作中的一个，可以由文字表示，也可以用字母、数字、符号等方式表示。

优选地，对动作序列进行优化处理，以提高数据准确性以及关联度，从而提高后续的模型运行效率以及准确度。

图2是图1中步骤S11的详细流程图。如图2所示，步骤S11进一步包括步骤：

S111、采集用户订单下单前的所有动作，并按形成时序排列所述动作以形成动作序列。即动作序列[a₁,a₂,…，a_i，a_i+1,…a_m]中，m为本次订单下单前的操作的所有动作的总数。在其他实施例中，也可以仅采集用户订单下单前的部分动作。相较于采集部分动作，采集所有动作进一步提高了数据精度以及准确性。

S112、合并动作序列中相邻的重复动作。用户在浏览中通常会出现重复操作，本实施例中，对于动作序列中相邻的重复的动作进行合并，即仅保留相邻的重复的动作中第一个动作。例如动作序列[a₁,a₂,…，a_i，a_i+1,…a_m]中a₁,a₂,a₃均为B，则合并相邻的重复动作，仅保留a₁。合并后得到更新的动作序列[a₁,a₂,…,a_l]，其中l≤m。在其他实例中，也可以不包括合并步骤，通过合并动作序列中相邻的重复动作可以有效地提高数据准确性，提高信息量，减小数据规模。

S113、保留下单前的t次动作，其中t为正整数。为了保证在最大信息量的同时减小数据冗余，本实施例中进一步仅保留下单前的t次动作，动作序列进一步更新为[a₁,a₂,…a_t]，其中t≤m。

通过步骤S11，有效地采集了下单前的操作的动作中的时序信息，从而提高数据分析维度，为后续用户行为监督模型提供可靠数据。

S12、将动作序列中的每一个动作匹配参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵，即将动作序列二值化。

将步骤S11中获取的动作序列中的每一个动作a_i匹配参考序列[A,B,C,D,E,F,G,H,I,J,K]而转化为一组由0或1组成的稀疏的动作向量。本实施例中，在动作向量中，在对应动作出现的位置元素为1，其他元素全为0。在其他实施例中对应动作出现的位置元素为0，其他元素全为1。例如，动作序列中的a₁为B，则匹配参考序列[A,B,C,D,E,F,G,H,I,J,K]，在B出现的位置元素为1，其他元素均为0，则将B转化为动作向量[0,1,0,0,…,0]表示。则动作序列[a₁,a₂,…a_t]转换为一k*t维的动作矩阵[A₁,A₂,…，A_t]。合并n个样本所对应的n个订单的动作矩阵，形成n*k*t维的行为矩阵。

通过步骤S12将步骤S11采集的动作序列转换为动作矩阵，从而实现时序信息的初步数值化。

S13、构建循环神经网络模型(Recurrent neural Network，RNN)。

图3是本发明一实施例的循环神经网络模型的示意图，为RNN模型全部展开时的情况，展开指的是用网络描述出所有序列。如图3所示，本发明的RNN模型包括输入层X_t，以及隐含层S_t，但不包括输出层。RNN的构建方式可以参考现有技术，本发明中循环神经网络模型符合下述公式(1)：

s_t＝f(U*x_t+W*s_t-1+b) (1)

其中，f为激活函数，激活函数f可以是下述函数中的任意一个：

ReLU(x)＝max(0，x)；以及

STA(x)＝max(0，|x|-α)。

S_t以及S_t-1为构建循环神经网络的隐藏层。x_t为步骤S12中的动作向量，即为输入层。

进一步的，设定循环神经网络模型的隐含层节点数为q，第一个隐含层S₀为任意q*1维向量。在本实施例中q取值大于等于64，小于等于256，从而保证模型具有必要的学习能力和信息处理能力的同时，不会增加网络结构的复杂性，不会影响模型的学习速度。

U，W为模型的参数矩阵，即权重矩阵。本发明中U,W为随机生成的k*q维向量，其中q为隐含层节点数，k为步骤S10中所有操作的动作的数量。

b为偏置项，在本实施例中b为q*1维的常数向量。在其他实施例中b可以设置为0，即不具有偏置项。

S14、将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据，输入循环神经网络模型，以训练循环神经网络模型。

步骤S14为RNN模型的训练步骤。如图3所示，按照次序分别将步骤S12中的动作矩阵中的动作向量输入RNN模型，并将与该动作矩阵对应的订单的样本标签y输入RNN模型，从而完成一次样本的输入。

例如，当前的动作矩阵为[A₁,A₂,…，A_t]，在时间点1，将动作向量A₁即为X₁，将动作向量A₁输入RNN模型中。以此类推，在时间点2，将动作向量A₂输入RNN模型中，直至在时间点t，将动作向量A_t输入RNN模型中。这里的时间点仅是指输入的动作向量的次序，并非是指具体的时间。在时间点t中，隐藏层S_t为其前一节点的隐藏层S_t以及X_t共同输入的结果。RNN模型隐含层的输出可以在下一个时间点直接作用到自身，即第i层隐含层在t时刻的输入，除了i-1层隐含层在该时刻的输出外，还包括其自身在t-1时刻输出，因此可以有效利用时序信息。

将n个样本，即n个动作矩阵形成的n*k*t维的行为矩阵以及与动作矩阵对应的订单的样本标签y输入循环神经网络模型，以训练循环神经网络模型。

继续参考图3，RNN模型通过反向推理调整其权重向量来训练。简单的说，就是根据计算出的总输出与目标输出即样本标签y之间的误差，从RNN模型的最终输出端反向逐层回归，利用损失函数的偏导调整每个权重向量。

具体而言，在步骤S14中构建损失函数loss，

将多个动作矩阵以及与动作矩阵对应的订单的样本标签y输入循环神经网络模型进行迭代，最小化损失函数loss，以获得最优的U，W，b。

损失函数loss符合以下公式(2)：

进一步地，预测概率p_i符合下述公式：

p_i＝softmax(w_out*s_t+b_out)

其中，w_out为模型的q*1维的参数矩阵，b_out为偏置项，S_t为构建循环神经网络的隐藏层。

将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入循环神经网络模型进行迭代，最小化损失函数，以获得最优的U，W，b，w_out以及b_out。

S15、输出最后一层的隐藏层作为输出结果。

根据公式(1)输出RNN模型中的最后一层隐藏层S_t作为输出结果。每一个S_t都是q*1维矩阵，n个样本则构成了n*q维输出结果，从而有效地将包含时序信息的订单的下单动作转化为矩阵的数据格式，从而实现处理和预测时间序列数据。

S16、将步骤S15中的所述输出结果作为输入数据，输入用户行为监督模型，以进行用户行为监督模型训练。

将S15中获取的最后一层隐藏层输出向量作为新的特征数据输入监督模型，监督模型包括逻辑回归，决策树，GBDT。用户的动作含有时序信息，通过步骤S11至S15进行采集以及量化，是对监督模型中数据的一种补充，包含时序信息的输入数据往往与原有数据的共线性不高，能在一定程度上提升监督模型效果。

本发明通过对于订单下单前动作的采集，按时序形成动作序列，从而获取UBT数据的时间序列信息。通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵，从而实现时序信息的初步数值化。通过构建循环神经网络模型以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现处理和预测时间序列数据，以使得提取后的时序数据能够被量化，以应用于用户行为监督模型。

本发明对用户动作中的时间序列信息进行抓取和提炼，以一种全新的方式来刻画监督模型的特征数据，并且新构造的特征数据与传统特征的共线性较低，能够对有监督模型训练在数据上提供补充。本发明先后应用于失联和催收等模型场景，模型的KS值得到了提升。此外，在大数据的背景下，用户的浏览行为中信息量十分丰富，通过本发明都可以很好地进行构造和刻画，适用于各种场景。

本发明还提供了一种用户行为量化的系统，该用户行为量化的系统用于有效采集UBT数据中隐藏的时间序列信息，并将其有效量化为传统模型训练可以接受的数据格式，有效提高了监督模型的准确性。

图4是本发明一实施例的包括用户行为量化的系统的模块示意图。如图4所示，本发明的用户行为量化的系统10包括动作采集模块11，转换模块12，模型构建模块13，模型训练模块14以及输出模块15。

动作采集模块11用于采集用户订单下单前的动作，按形成时序排列所述动作以形成动作序列。

转换模块12用于将订单涉及的所有动作按固定次序预先排列为一参考序列，将动作序列中的每一个动作匹配参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵。

模型构建模块用于构建循环神经网络模型，循环神经网络模型符合下述公式：

s_t＝f(U*x_t+W*s_t-1+b)

其中，f为激活函数，S_t以及S_t-1为构建循环神经网络的隐藏层，U，W为模型的参数矩阵，b为偏置项，x_t为转换模块12转换后的动作向量。

模型训练模块14用于将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据，输入循环神经网络模型，以训练循环神经网络模型。

输出模块15用于输出最后一层的隐藏层作为输出结果。

可以理解的是，本用户行为量化的系统10还包括其他支持用户行为量化的系统10运行的现有功能模块。图4显示的用户行为量化的系统10仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

本实施例中的用户行为量化的系统10用于实现上述的用户行为量化的方法，因此对于用户行为量化的系统10的具体实施步骤可以参照上述对用户行为量化的方法的描述，此处不再赘述。

本发明所提供的用户行为量化的系统针对现有技术的互联网订单的UBT数据分析中没有考虑UBT数据的时间序列信息，无法有效地提取出UBT数据中隐藏的时间序列信息的问题，通过对于订单下单前动作的采集，按时序形成动作序列，从而获取UBT数据的时间序列信息。通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵，从而实现时序信息的初步数值化。通过构建循环神经网络模型以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现处理和预测时间序列数据，以使得提取后的时序数据能够被量化，以应用于用户行为监督模型，从而使得监督模型中能够使用包括时序信息的特征数据，有效提高监督模型准确性。

本发明实施例还提供一种用户行为量化设备，包括处理器。存储器，其中存储有处理器的可执行指令。其中，处理器配置为经由执行可执行指令来执行的上述的用户行为量化的方法的步骤。

如上，该实施例通过对于订单下单前动作的采集，按时序形成动作序列，从而获取UBT数据的时间序列信息。通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵，从而实现时序信息的初步数值化，通过构建循环神经网络模型以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现处理和预测时间序列数据，以使得提取后的时序数据能够被量化，以应用于用户行为监督模型，从而使得监督模型中能够使用包括时序信息的特征数据，有效提高监督模型准确性。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“平台”。

图5是本发明一实施例的用户行为量化设备的结构示意图。下面参照图5来描述根据本发明的这种实施方式的用户行为量化设备600。图5显示的用户行为量化设备600仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，用户行为量化设备600以通用计算设备的形式表现。用户行为量化设备600的组件可以包括但不限于：至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中，存储单元存储有程序代码，程序代码可以被处理单元610执行，使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如，处理单元610可以执行如图1中所示的步骤。

存储单元620可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202，还可以进一步包括只读存储单元(ROM)6203。

存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204，这样的程序模块6205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

用户行为量化设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该用户行为量化设备600交互的设备通信，和/或与使得该用户行为量化设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且，用户行为量化设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器660可以通过总线630与用户行为量化设备600的其它模块通信。应当明白，尽管图中未示出，可以结合用户行为量化设备600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。

本发明实施例还提供一种计算机可读存储介质，用于存储程序，程序被执行时实现上述实施例中的用户行为量化的方法的步骤。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在终端设备上运行时，程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。

如上所示，该实施例的计算机可读存储介质的程序在执行时，通过对于订单下单前动作的采集，按时序形成动作序列，从而获取UBT数据的时间序列信息，通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵，从而实现时序信息的初步数值化，通过构建循环神经网络模型以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现处理和预测时间序列数据，以使得提取后的时序数据能够被量化，以应用于用户行为监督模型，从而使得监督模型中能够使用包括时序信息的特征数据，有效提高监督模型准确性。

图6是本发明一实施例的计算机可读存储介质的结构示意图。参考图6所示，描述了根据本发明的实施方式的用于实现上述方法的程序产品800，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本发明的用户行为量化的方法、系统、设备及存储介质通过对于订单下单前动作的采集，按时序形成动作序列，从而获取UBT数据的时间序列信息。

通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量，以将动作序列转换为动作矩阵，从而实现时序信息的初步数值化。

通过构建循环神经网络模型以及训练循环神经网络模型，输出最后一层的隐藏层，从而实现处理和预测时间序列数据，以使得提取后的时序数据能够被量化，以应用于用户行为监督模型，从而使得监督模型中能够使用包括时序信息的特征数据，有效提高监督模型准确性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种用户行为量化的方法，其特征在于，包括以下步骤：

S10、将订单涉及的所有动作按固定次序预先排列为一参考序列；

S11、采集用户订单下单前的操作的动作，按形成时序排列所述动作以形成动作序列；

S12、将所述动作序列中的每一个动作匹配所述参考序列而转换为一组由0或1表示的动作向量，以将所述动作序列转换为动作矩阵；

S13、构建循环神经网络模型，所述循环神经网络模型符合公式：

s_t＝f(U*x_t+W*s_t-1+b)

其中，f为激活函数，S_t以及S_t-1为构建循环神经网络的隐藏层，U，W为模型的参数矩阵，b为偏置项，x_t为步骤S12中的所述动作向量；

S14、将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据，输入所述循环神经网络模型，以训练循环神经网络模型；

S15、输出最后一层的隐藏层作为输出结果。

2.如权利要求1所述的用户行为量化的方法，其特征在于，所述步骤S11包括：

S111、采集用户订单下单前的所有动作，并按形成时序排列所述动作以形成动作序列；

S113、保留下单前的t次动作，其中t为正整数。

3.如权利要求2所述的用户行为量化的方法，其特征在于，在所述步骤S11中，在步骤S113前还包括步骤：

S112、合并动作序列中相邻的重复动作。

4.如权利要求1所述的用户行为量化的方法，其特征在于在步骤S14的循环神经网络模型中构建损失函数loss，

将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入所述循环神经网络模型进行迭代，最小化损失函数，以获得最优的U，W，b，

损失函数loss符合以下公式：

5.如权利要求4所述的用户行为量化的方法，其特征在于在步骤S14中，预测概率p_i符合下述公式：

p_i＝softmax(w_out*s_t+b_out)

其中，w_out为模型的参数矩阵，b_out为偏置项，S_t为构建循环神经网络的隐藏层；

将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入所述循环神经网络模型进行迭代，最小化损失函数，以获得最优的w_out以及b_out。

6.如权利要求1所述的用户行为量化的方法，其特征在于，在步骤S13中，

设定循环神经网络模型的隐含层节点数为q，第一个隐含层S₀为任意q*1维向量。

7.如权利要求1所述的用户行为量化的方法，其特征在于还包括步骤：

8.一种用户行为量化的系统，其特征在于包括：

动作采集模块，所述动作采集模块用于采集用户订单下单前的动作，按形成时序排列所述动作以形成动作序列；

转换模块，所述转换模块用于将订单涉及的所有动作按固定次序预先排列为一参考序列，将所述动作序列中的每一个动作匹配所述参考序列而转换为一组由0或1表示的动作向量，以将所述动作序列转换为动作矩阵；

模型构建模块，所述模型构建模块用于构建循环神经网络模型，所述循环神经网络模型符合公式：

s_t＝f(U*x_t+W*s_t-1+b)

其中，f为激活函数，S_t以及S_t-1为构建循环神经网络的隐藏层，U，W为模型的参数矩阵，b为偏置项，x_t为所述转换模块转换后的所述动作向量；

模型训练模块，所述模型训练模块用于将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据，输入所述循环神经网络模型，以训练循环神经网络模型；

输出模块，所述输出模块用于输出最后一层的隐藏层作为输出结果。

9.一种用户行为量化的设备，其特征在于，包括：

处理器；

存储器，其中存储有所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至5中任意一项所述用户行为量化的方法的步骤。

10.一种计算机可读存储介质，用于存储程序，其特征在于，所述程序被执行时实现权利要求1至5中任意一项所述用户行为量化的方法的步骤。