CN110826695B

CN110826695B - 数据处理方法、装置和计算机可读存储介质

Info

Publication number: CN110826695B
Application number: CN201911042227.1A
Authority: CN
Inventors: 李婷; 张钧波; 郑宇�
Original assignee: Jingdong Digital City Chengdu Technology Co ltd
Current assignee: Jingdong Digital City Chengdu Technology Co ltd
Priority date: 2019-10-30
Filing date: 2019-10-30
Publication date: 2021-05-25
Anticipated expiration: 2039-10-30
Also published as: CN110826695A

Abstract

本公开涉及一种数据处理方法、装置和计算机可读存储介质，涉及计算机技术领域。本公开的方法包括：将样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据输入预测模型；其中，当前时间窗口至少包括当前时刻；利用预测模型中结构控制器和门循环神经单元对输入数据进行运算，确定各个序列对应的预测模型当前时刻输出的数据；根据各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据的差异，对结构控制器的参数和门循环神经单元的参数分别进行调整，以便确定预测模型的结构和模型参数；其中，通过调整结构控制器的参数调整输入数据的权重，以及调整预测模型中多个激活函数的权重。

Description

数据处理方法、装置和计算机可读存储介质

技术领域

本公开涉及计算机技术领域，特别涉及一种数据处理方法、装置和计算机可读存储介质。

背景技术

神经网络模型是目前计算机、人工智能等领域常用的机器学习模型。其中，循环神经网络(Recurrent Neural Network，RNN)等模型中包括门循环神经单元(GatedRecurrent Unit，GRU)，常用于对序列的预测。

目前，技术人员在应用包含门循环神经单元的预测模型时，针对不同类型的数据，根据经验预设模型的网络结构和输入方式进行训练，如果发现训练结果无法达到预期(例如，无法收敛、过拟合等)，需要人工重新调整预测模型的网络结构和输入方式。

发明内容

发明人发现：针对不同场景和不同类型的数据，需要人工调整预测模型的网络结构和输入方式，效率较低。

本公开所要解决的一个技术问题是：提出一种自动机器学习预测模型的网络结构和输入方式的方案，使预测模型可以自动适应不同场景不同类型的数据，提高预测模型调整的效率。

根据本公开的一些实施例，提供的一种数据处理方法，包括：将样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据输入预测模型；其中，当前时间窗口至少包括当前时刻；利用预测模型中结构控制器和门循环神经单元对输入数据进行运算，确定各个序列对应的预测模型当前时刻输出的数据；根据各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据的差异，对结构控制器的参数和门循环神经单元的参数分别进行调整，以便确定预测模型的结构和模型参数；其中，通过调整结构控制器的参数调整输入数据的权重，以及调整预测模型中多个激活函数的权重。

在一些实施例中，利用预测模型中结构控制器和门循环神经单元对输入数据进行运算包括：针对每个门循环神经单元和每个序列对应的输入数据，根据输入数据的各种选择方式，分别确定门循环神经单元中的更新门的输出值和复位门的输出值；根据每种选择方式对应的更新门的输出值和复位门的输出值，以及结构控制器中连接控制器的参数，确定更新门的混合输出值和复位门的混合输出值；根据更新门的混合输出值和复位门的混合输出值，确定门循环神经单元中各个激活函数的输出值；根据门循环神经单元中各个激活函数的输出值，以及结构控制器中激活控制器的参数，确定各个激活函数的混合输出值。

在一些实施例中，输入数据的各种选择方式包括：选择该序列的当前时间窗口内各个时刻的数据进行运算；或者，不选择该序列的当前时间窗口内各个时刻的数据进行运算；根据输入数据的每种选择方式，分别确定门循环神经单元中的更新门的输出值和复位门的输出值包括：将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第一输出值；将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第一输出值；将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第二输出值；将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第二输出值。

在一些实施例中，确定更新门的混合输出值和复位门的混合输出值包括：根据结构控制器中连接控制器的参数对更新门的第一输出值和更新门的第二输出值进行加权，得到更新门的混合输出值；根据结构控制器中连接控制器的参数对复位门的第一输出值和复位门的第二输出值进行加权，得到复位门的混合输出值。

在一些实施例中，确定各个激活函数的混合输出值包括：根据结构控制器中激活控制器的参数，对各个激活函数的输出值进行加权，得到各个激活函数的混合输出值。

在一些实施例中，样本集包括：第一子样本集和第二子样本集；对结构控制器的参数和门循环神经单元的参数分别进行调整包括：根据第一子样本集中各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第一损失函数，根据第一损失函数对结构控制器的参数进行调整；根据第二子样本集中各个序列的各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第二损失函数，根据第二损失函数对门循环神经单元的参数的参数进行调整。

在一些实施例中，对结构控制器的参数和门循环神经单元的参数分别进行调整还包括：判断第一损失函数的值是否达到预设条件；在第一损失函数的值达到预设条件的情况下，根据结构控制器的参数，确定预测模型的结构。

在一些实施例中，确定预测模型的结构和模型参数包括：利用第二子样本集中的数据对确定结构后的预测模型进行训练，确定门循环神经单元的参数，以确定预测模型的模型参数。

在一些实施例中，利用第二子样本集中的数据对确定结构后的预测模型进行训练包括：将第二子样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据，输入确定结构后的预测模型；利用门循环神经单元对输入数据进行运算，确定各个序列对应的确定结构后的预测模型当前时刻输出的数据；根据各个序列的下一时刻的数据和各个序列对应的确定结构后的预测模型当前时刻输出的数据的差异，对门循环神经单元的参数进行调整。

在一些实施例中，该方法还包括：将待预测的序列的当前时间窗口内各个时刻的数据输入预测模型，得到输出的待预测的序列的下一时刻的预测数据。

在一些实施例中，序列为预设区域的按时间顺序排列的各个时刻的人流量数据，车流量数据或网络流量数据；或者，序列为多个词语组成的句子。

根据本公开的另一些实施例，提供的一种数据处理装置，包括：样本输入模块，用于将样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据输入预测模型；其中，当前时间窗口至少包括当前时刻；输出模块，用于利用预测模型中结构控制器和门循环神经单元对输入数据进行运算，确定各个序列对应的预测模型当前时刻输出的数据；参数调整模块，用于根据各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据的差异，对结构控制器的参数和门循环神经单元的参数分别进行调整，以便确定预测模型的结构和模型参数；其中，通过调整结构控制器的参数调整输入数据的权重，以及调整预测模型中多个激活函数的权重。

在一些实施例中，输出模块用于针对每个门循环神经单元和每个序列对应的输入数据，根据输入数据的各种选择方式，分别确定门循环神经单元中的更新门的输出值和复位门的输出值；根据每种选择方式对应的更新门的输出值和复位门的输出值，以及结构控制器中连接控制器的参数，确定更新门的混合输出值和复位门的混合输出值；根据更新门的混合输出值和复位门的混合输出值，确定门循环神经单元中各个激活函数的输出值；根据门循环神经单元中各个激活函数的输出值，以及结构控制器中激活控制器的参数，确定各个激活函数的混合输出值。

在一些实施例中，输入数据的各种选择方式包括：选择该序列的当前时间窗口内各个时刻的数据进行运算；或者，不选择该序列的当前时间窗口内各个时刻的数据进行运算；输出模块用于将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第一输出值；将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第一输出值；将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第二输出值；将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第二输出值。

在一些实施例中，输出模块用于根据结构控制器中连接控制器的参数对更新门的第一输出值和更新门的第二输出值进行加权，得到更新门的混合输出值；根据结构控制器中连接控制器的参数对复位门的第一输出值和复位门的第二输出值进行加权，得到复位门的混合输出值。

在一些实施例中，输出模块用于根据结构控制器中激活控制器的参数，对各个激活函数的输出值进行加权，得到各个激活函数的混合输出值。

在一些实施例中，样本集包括：第一子样本集和第二子样本集；参数调整模块用于根据第一子样本集中各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第一损失函数，根据第一损失函数对结构控制器的参数进行调整；根据第二子样本集中各个序列的各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第二损失函数，根据第二损失函数对门循环神经单元的参数的参数进行调整。

在一些实施例中，参数调整模块用于判断第一损失函数的值是否达到预设条件；在第一损失函数的值达到预设条件的情况下，根据结构控制器的参数，确定预测模型的结构。

在一些实施例中，参数调整模块用于利用第二子样本集中的数据对确定结构后的预测模型进行训练，确定门循环神经单元的参数，以确定预测模型的模型参数。

在一些实施例中，参数调整模块用于将第二子样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据，输入确定结构后的预测模型；利用门循环神经单元对输入数据进行运算，确定各个序列对应的确定结构后的预测模型当前时刻输出的数据；根据各个序列的下一时刻的数据和各个序列对应的确定结构后的预测模型当前时刻输出的数据的差异，对门循环神经单元的参数进行调整。

在一些实施例中，该装置还包括：预测模块用于将待预测的序列的当前时间窗口内各个时刻的数据输入预测模型，得到输出的待预测的序列的下一时刻的预测数据。

根据本公开的又一些实施例，提供的一种数据处理装置，包括：处理器；以及耦接至处理器的存储器，用于存储指令，指令被处理器执行时，使处理器执行如前述任意实施例的数据处理方法。

根据本公开的再一些实施例，提供的一种计算机可读非瞬时性存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现前述任意实施例的数据处理方法。

本公开中在预测模型中加入结构控制器，结构控制器可以用于调整输入方式和预测模型的网络结构。将样本集中各个序列的当前时间窗口内各个时刻的数据，输入预测模型。根据预测模型当前时刻输出的数据和对应的各个序列的下一时刻的数据的差异，调整结构控制器的参数和门循环神经单元的参数，从而调整输入数据的权重，预测模型中多个激活函数的权重以及预测模型的模型参数，最终得到适用于当前场景和数据类型的预测模型。本公开采用自动机器学习的方式，学习预测模型的网络结构和输入方式，使预测模型可以自动适应不同场景不同类型的数据，提高了预测模型调整的效率。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本公开的一些实施例的数据处理方法的流程示意图。

图2示出本公开的另一些实施例的数据处理方法的流程示意图。

图3示出本公开的又一些实施例的数据处理方法的流程示意图。

图4示出本公开的一些实施例的数据处理装置的结构示意图。

图5示出本公开的另一些实施例的数据处理装置的结构示意图。

图6示出本公开的又一些实施例的数据处理装置的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开提出一种自动机器学习的方法，使预测模型可以自动适应不同场景不同类型的数据，下面结合图1进行描述。

图1为本公开数据处理方法一些实施例的流程图。如图1所示，该实施例的方法包括：步骤S102～S106。

在步骤S102中，将样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据输入预测模型。

本公开的方法可以应用于各种场景不同类型的数据。例如，针对预设区域(例如，店铺、车站等)不同时刻的人流量(或人数)或车流量(或车辆数)或网络流量进行预测的场景，样本集中的序列可以是该预设区域按时间顺序排列的历史各个时刻的人流量数据，车流量数据，或网络流量数据等。又例如，针对自然语言处理自动生成句子的场景，样本集中的序列可以是多个词语组成的句子，不同时刻的数据表示不同的词语。又例如，针对网站不同时刻的流量或访问量进行预测的场景，样本集中的序列可以是该网站按时间顺序排列的历史各个时刻的流量或访问量等，不限于所举示例。

预测模型可以包括一个或多个门神经网络单元(GRU)，还可以根据需求增加其他层形成新的模型。当前时间窗口至少包括当前时刻，在预测模型包含多个GRU的情况下，输入除了序列当前时刻的数据x_t，还可以包括当前时刻之前的多个历史时刻的数据x_t-1，x_t-2…。每个序列历史各个时刻和当前时刻的数据中每个时刻数据输入一个对应的GRU。针对每一个GRU在模型内部还输入对应的时刻的上一时刻隐层输出的数据，即上一个GRU输出的数据。例如，当前时刻t对应的GRU除了输入x_t还输入上一时刻隐层输出的数据h_t-1。针对每一个GRU，对应的时刻可以看作当前时刻。具体输入方式可以参考现有技术，在此不再赘述。

在步骤S104中，利用预测模型中结构控制器和门循环神经单元对输入数据进行运算，确定各个序列对应的预测模型当前时刻输出的数据。

结构控制器可以包括连接控制器和激活控制器。连接控制器可以定义为

来控制输入数据的选择，其中l_s是序列输入的长度，l_c是输入数据的选择方式的数量，例如，l_c＝2表示只考虑两种选择方式即选择该序列的当前时间窗口内各个时刻的数据进行运算，或者不选择该序列的当前时间窗口内各个时刻的数据进行运算，可以表示为connections＝[none,identity]。激活控制器可以定义

其中l_a是激活函数的个数，例如，l_a＝5表示考虑5种情况activations＝[sigmoid,tanh,relu,none,identity]。将连接控制器和激活控制器统称为结构控制器，即结构控制器可以表示为w_arch＝{w_con,w_act}。

GRU的结构可以重写为：

r_t＝σ_g(mix_connections(W_irx_t+b_ir)+W_hrh_t-1+b_hr) (1)

z_t＝σ_g(mix_connections(W_izx_t+b_iz)+W_hzh_t-1+b_hz) (2)

n_t＝mix_activation(W_inx_t+b_in+r_t*(W_hnh_t-1+b_hn)) (3)

h_t＝(1-z_t)*n_t+z_t*h_t-1 (4)

其中，r_t表示t时刻更新门r的输出，z_t表示t时刻复位门(也可以称为重置门)z的输出，n_t表示t时刻激活函数的输出，h_t表示t时刻隐层的输出，h_t-1表示t-1时刻隐层的输出，mix_connections()表示根据输入数据的选择方式进行计算，例如，只考虑上述两种选择方式的情况下，如果connections＝none，则mix_connections(W_irx_t+b_ir)为0，否则mix_connections(W_irx_t+b_ir)＝W_irx_t+b_ir。

mix_activation()表示选择的激活函数。

w_model＝{W_ir,W_hr,W_iz,W_hz,W_in,W_hn,}即模型参数，包括GRU的参数。b_ir，b_hr，b_iz，b_hz，b_in，b_hn为偏置。

在一些实施例中，如图2所示，一次训练过程中，利用预测模型中结构控制器和门循环神经单元对输入数据进行运算包括：步骤S202～S208。

在步骤S202中，针对每个门循环神经单元和每个序列对应的输入数据，根据输入数据的各种选择方式，分别确定门循环神经单元中的更新门的输出值和复位门的输出值。

在步骤S204中，根据每种选择方式对应的更新门的输出值和复位门的输出值，以及结构控制器中连接控制器的参数，确定更新门的混合输出值和复位门的混合输出值。

在步骤S206中，根据更新门的混合输出值和复位门的混合输出值，确定门循环神经单元中各个激活函数的输出值。

在步骤S208中，根据门循环神经单元中各个激活函数的输出值，以及结构控制器中激活控制器的参数，确定各个激活函数的混合输出值。

具体可以采用以下方法确定更新门的混合输出值和复位门的混合输出值。

将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第一输出值。例如，可以采用以下公式表示更新门的第一输出值。

r_identity＝σ_g(W_irx_t+b_ir+W_hrh_t-1+b_hr) (5)

将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第二输出值。例如，可以采用以下公式表示更新门的第二输出值。

r_none＝σ_g(w_hrh_t-1+b_hr) (6)

将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第一输出值。例如，可以采用以下公式表示复位门的第一输出值。

z_identity＝σ_g(W_izx_t+b_iz+W_hzh_t-1+b_hz) (7)

将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第二输出值。例如，可以采用以下公式表示复位门的第二输出值。

z_none＝σ_g(w_hzh_t-1+b_hz) (8)

进一步，根据结构控制器中连接控制器的参数对更新门的第一输出值和更新门的第二输出值进行加权，得到更新门的混合输出值，可以采用以下公式表示。

r_{mix_con}＝r_none*w_con[:,0]+r_identity*w_con[:,1] (9)

其中，w_con[:,0]表示对w_con这个二维数组取第一维中该GRU对应的数据，w_con[:,1]表示对w_con这个二维数组取第二维中该GRU对应的数据。

根据结构控制器中连接控制器的参数对复位门的第一输出值和复位门的第二输出值进行加权，得到复位门的混合输出值，可以采用以下公式表示。

z_{mix_con}＝z_none*w_con[:,0]+z_identity*W_con[:,1] (10)

通过上述实施例可以看出通过调整结构控制器的参数可以调整输入数据的权重，即调整输入数据的选择方式。例如，上述实施例中，通过调整连接控制器的参数，可以选择x_t进行更新门和复位门的运算，也可以不选择x_t进行更新门和复位门的运算。

具体可以采用以下方法确定各个激活函数的混合输出值。

根据更新门的混合输出值和复位门的混合输出值，确定门循环神经单元中各个激活函数的输出值。例如，可以采用以下公式表示各个激活函数的输出值。

可以根据实际需求选取的激活函数的种类，不限于所举示例。

进一步，根据结构控制器中激活控制器的参数，对各个激活函数的输出值进行加权，得到各个激活函数的混合输出值，可以采用以下公式表示。

h_{mix_act}＝h_none*w_act[:,0]+h_identity*w_act[:,1]+h_relu*w_act[:,2]+h_sigmoid*w_act[:,3]+h_tanh*w_tanh[:,4] (16)

其中，w_act[:,0]表示对w_act这个二维数组取第一维中该GRU对应的数据，w_act[:,1]表示对w_act这个二维数组取第二维中该GRU对应的数据，以此类推。h_{mix_act}即为一次训练过程中一个GRU的输出，每个GRU都可以参考以上计算方法，只需要将t时刻的数据更换为对应时刻的数据即可。进一步，如图2所示，图2所示实施例还包括：在步骤S210中，根据各个序列对应的各个激活函数的混合输出值，确定各个序列对应的预测模型当前时刻输出的数据。

通过上述实施例可以看出通过调整结构控制器的参数可以调整预测模型中多个激活函数的权重，即调整多个激活函数的选择。

在步骤S106中，根据各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据的差异，对结构控制器的参数和门循环神经单元的参数分别进行调整，以便确定预测模型的结构和模型参数。

在一些实施例中，样本集包括：第一子样本集和第二子样本集；即可以将样本集划分为第一子样本集和第二子样本集。对结构控制器的参数和门循环神经单元的参数分别进行调整可以作为预测模型训练过程中的步骤。

具体的，根据前述的方法，第一子样本集和第二子样本集中的序列输入预测模型后，得到各个序列对应的预测模型当前时刻输出的数据，进一步，如图3所示，对结构控制器的参数和门循环神经单元的参数分别进行调整包括：步骤S302～S308。

在步骤S302中，根据第一子样本集中各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第一损失函数。

在步骤S304中，判断第一损失函数的值是否达到预设条件，如果是，则执行步骤S306，否则，执行步骤S305。

在步骤S306中，根据结构控制器的参数确定预测模型的结构。

在步骤S305中，根据第一损失函数对结构控制器的参数进行调整。

在步骤S307中，根据第二子样本集中各个序列的各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第二损失函数，根据第二损失函数对门循环神经单元的参数的参数进行调整。之后返回步骤S302重新开始执行。

第一损失函数和第二损失函数可以采用相同或不同的计算方法，例如，两者都可以采用以下公式进行计算。

其中，N表示样本总量，i表示样本(即序列)的编号，h_pred＝sigmoid(h_{mix_act})表示预测模型当前时刻输出的数据，

表示第i个样本下一时刻的真实数据。

进一步，可以定义模型优化器optimizer_model和结构优化器optimizer_arch来迭代优化出最优的结构控制器的参数。

上述公式可以理解为采用梯度下降的方法进行参数的优化，loss₁表示第一损失函数，loss₂表示第二损失函数，w_arch即结构控制器的参数，w_model为模型参数。训练过程中，结构控制器参数和模型参数可以采用交替调整的方式进行调整，即一次循环根据公式(18)调整结构控制器的参数，此时固定模型参数，下一次循环则根据公式(19)调整模型参数，固定结构控制器参数，如此交替训练，每次调整结构控制器的参数可以判断第一损失函数的值是否达到预设条件，直至第一损失函数的值达到预设条件的情况下，根据结构控制器的参数，确定预测模型的结构。预设条件例如为第一损失函数值小于阈值或达到最小等条件。

在一些实施例中，如图3所示，在步骤S306之后还包括：在步骤S308中，确定预测模型的结构之后可以继续利用第二子样本集中的数据对确定结构后的预测模型进行训练，确定门循环神经单元的参数，以确定预测模型的模型参数。

在一些实施例中，将第二子样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据，输入确定结构后的预测模型；利用门循环神经单元对输入数据进行运算，确定各个序列对应的确定结构后的预测模型当前时刻输出的数据；根据各个序列的下一时刻的数据和各个序列对应的确定结构后的预测模型当前时刻输出的数据的差异，对门循环神经单元的参数进行调整。可以参考前述实施例的方法继续对预测模型进行训练，直至第二损失函数低于对应的预设值或达到最小，完成对预测模型的训练。

上述实施例中在预测模型中加入结构控制器，结构控制器可以用于调整输入方式和预测模型的网络结构。将样本集中各个序列的当前时间窗口内各个时刻的数据，输入预测模型。根据预测模型当前时刻输出的数据和对应的各个序列的下一时刻的数据的差异，调整结构控制器的参数和门循环神经单元的参数，从而调整输入数据的权重，预测模型中多个激活函数的权重以及预测模型的模型参数，最终得到适用于当前场景和数据类型的预测模型。上述实施例中采用自动机器学习的方式，学习预测模型的网络结构和输入方式，使预测模型可以自动适应不同场景不同类型的数据，提高了预测模型调整的效率。

在一些实施例中，如图1所示，在步骤S106之后还可以包括：在步骤S108中，将待预测的序列的当前时间窗口内各个时刻的数据输入预测模型，得到输出的待预测的序列的下一时刻的预测数据。

例如，待预测的序列为预设区域的不同时刻的人流量、车流量、网络流量等数据，或者，待预测的序列为一个句子或一段文字等。

本公开还提供一种数据处理装置，下面结合图4进行描述。

图4为本公开数据处理装置的一些实施例的结构图。如图4所示，该实施例的装置40包括：样本输入模块410，输出模块420，参数调整模块430。

样本输入模块410，用于将样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据输入预测模型；其中，当前时间窗口至少包括当前时刻。

输出模块420，用于利用预测模型中结构控制器和门循环神经单元对输入数据进行运算，确定各个序列对应的预测模型当前时刻输出的数据。

通过调整结构控制器的参数可以调整输入数据的权重，以及调整预测模型中多个激活函数的权重。

在一些实施例中，输出模块用于420针对每个门循环神经单元和每个序列对应的输入数据，根据输入数据的各种选择方式，分别确定门循环神经单元中的更新门的输出值和复位门的输出值；根据每种选择方式对应的更新门的输出值和复位门的输出值，以及结构控制器中连接控制器的参数，确定更新门的混合输出值和复位门的混合输出值；根据更新门的混合输出值和复位门的混合输出值，确定门循环神经单元中各个激活函数的输出值；根据门循环神经单元中各个激活函数的输出值，以及结构控制器中激活控制器的参数，确定各个激活函数的混合输出值。

在一些实施例中，输入数据的各种选择方式包括：选择该序列的当前时间窗口内各个时刻的数据进行运算；或者，不选择该序列的当前时间窗口内各个时刻的数据进行运算；输出模块420用于将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第一输出值；将门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第一输出值；将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入更新门，得到更新门的第二输出值；将门循环神经单元对应的时刻的上一时刻隐层输出的数据输入复位门，得到复位门的第二输出值。

在一些实施例中，输出模块420用于根据结构控制器中连接控制器的参数对更新门的第一输出值和更新门的第二输出值进行加权，得到更新门的混合输出值；根据结构控制器中连接控制器的参数对复位门的第一输出值和复位门的第二输出值进行加权，得到复位门的混合输出值。

在一些实施例中，输出模块420用于根据结构控制器中激活控制器的参数，对各个激活函数的输出值进行加权，得到各个激活函数的混合输出值。

参数调整模块430，用于根据各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据的差异，对结构控制器的参数和门循环神经单元的参数分别进行调整，以便确定预测模型的结构和模型参数。

在一些实施例中，样本集包括：第一子样本集和第二子样本集；参数调整模块430用于根据第一子样本集中各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第一损失函数，根据第一损失函数对结构控制器的参数进行调整；根据第二子样本集中各个序列的各个序列的下一时刻的数据和各个序列对应的预测模型当前时刻输出的数据，计算第二损失函数，根据第二损失函数对门循环神经单元的参数的参数进行调整。

在一些实施例中，参数调整模块430用于判断第一损失函数的值是否达到预设条件；在第一损失函数的值达到预设条件的情况下，根据结构控制器的参数，确定预测模型的结构。

在一些实施例中，参数调整模块430用于利用第二子样本集中的数据对确定结构后的预测模型进行训练，确定门循环神经单元的参数，以确定预测模型的模型参数。

在一些实施例中，参数调整模块430用于将第二子样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据，输入确定结构后的预测模型；利用门循环神经单元对输入数据进行运算，确定各个序列对应的确定结构后的预测模型当前时刻输出的数据；根据各个序列的下一时刻的数据和各个序列对应的确定结构后的预测模型当前时刻输出的数据的差异，对门循环神经单元的参数进行调整。

在一些实施例中，该装置还包括：预测模块440用于将待预测的序列的当前时间窗口内各个时刻的数据输入预测模型，得到输出的待预测的序列的下一时刻的预测数据。

本公开的实施例中的数据处理装置可各由各种计算设备或计算机系统来实现，下面结合图5以及图6进行描述。

图5为本公开数据处理装置的一些实施例的结构图。如图5所示，该实施例的装置50包括：存储器510以及耦接至该存储器510的处理器520，处理器520被配置为基于存储在存储器110中的指令，执行本公开中任意一些实施例中的数据处理方法。

其中，存储器510例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。

图6为本公开数据处理装置的另一些实施例的结构图。如图6所示，该实施例的装置60包括：存储器610以及处理器620，分别与存储器510以及处理器520类似。还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630，640，650以及存储器610和处理器620之间例如可以通过总线660连接。其中，输入输出接口630为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口，例如可以连接到数据库服务器或者云端存储服务器等。存储接口650为SD卡、U盘等外置存储设备提供连接接口。

本领域内的技术人员应当明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本公开的较佳实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种数据处理方法，包括：在样本集中的每个序列包括：预设区域内按时间顺序排列的历史各个时刻和当前时刻的人流量数据的情况下，

将样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据输入预测模型；其中，所述当前时间窗口至少包括当前时刻；

利用所述预测模型中结构控制器和门循环神经单元对所述输入数据进行运算，确定所述各个序列对应的所述预测模型当前时刻输出的数据；

根据所述各个序列的下一时刻的数据和所述各个序列对应的所述预测模型当前时刻输出的数据的差异，对所述结构控制器的参数和所述门循环神经单元的参数分别进行调整，以便确定所述预测模型的结构和模型参数；

其中，通过调整所述结构控制器的参数调整输入数据的权重，以及调整所述预测模型中多个激活函数的权重。

2.一种数据处理方法，包括：在样本集中的每个序列包括：预设区域内按时间顺序排列的历史各个时刻和当前时刻的车流量数据的情况下，

3.一种数据处理方法，包括：在样本集中的每个序列包括：预设区域内按时间顺序排列的历史各个时刻和当前时刻的网络流量数据的情况下，

4.一种数据处理方法，包括：在样本集中的每个序列包括：多个词语组成的句子，不同时刻的数据表示不同的词语的情况下，

5.一种数据处理方法，包括：在样本集中的每个序列包括：预设网站按时间顺序排列的历史各个时刻和当前时刻的流量或访问量的情况下，

6.根据权利要求1-5任一项所述的数据处理方法，其中，

所述利用所述预测模型中结构控制器和门循环神经单元对所述输入数据进行运算包括：

针对每个门循环神经单元和每个序列对应的所述输入数据，根据所述输入数据的各种选择方式，分别确定所述门循环神经单元中的更新门的输出值和复位门的输出值；

根据每种选择方式对应的所述更新门的输出值和复位门的输出值，以及所述结构控制器中连接控制器的参数，确定所述更新门的混合输出值和所述复位门的混合输出值；

根据所述更新门的混合输出值和所述复位门的混合输出值，确定所述门循环神经单元中各个激活函数的输出值；

根据所述门循环神经单元中各个激活函数的输出值，以及所述结构控制器中激活控制器的参数，确定各个激活函数的混合输出值。

7.根据权利要求6所述的数据处理方法，其中，

所述输入数据的各种选择方式包括：选择该序列的当前时间窗口内各个时刻的数据进行运算；或者，不选择该序列的当前时间窗口内各个时刻的数据进行运算；

所述根据所述输入数据的每种选择方式，分别确定所述门循环神经单元中的更新门的输出值和复位门的输出值包括：

将所述门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入所述更新门，得到所述更新门的第一输出值；

将所述门循环神经单元对应的该序列的当前时间窗口内一个时刻的数据以及该时刻的上一时刻隐层输出的数据输入所述复位门，得到所述复位门的第一输出值；

将所述门循环神经单元对应的时刻的上一时刻隐层输出的数据输入所述更新门，得到所述更新门的第二输出值；

将所述门循环神经单元对应的时刻的上一时刻隐层输出的数据输入所述复位门，得到所述复位门的第二输出值。

8.根据权利要求7所述的数据处理方法，其中，

所述确定所述更新门的混合输出值和所述复位门的混合输出值包括：

根据所述结构控制器中连接控制器的参数对所述更新门的第一输出值和所述更新门的第二输出值进行加权，得到所述更新门的混合输出值；

根据所述结构控制器中连接控制器的参数对所述复位门的第一输出值和所述复位门的第二输出值进行加权，得到所述复位门的混合输出值。

9.根据权利要求6所述的数据处理方法，其中，

所述确定各个激活函数的混合输出值包括：

根据所述结构控制器中激活控制器的参数，对各个激活函数的输出值进行加权，得到各个激活函数的混合输出值。

10.根据权利要求6所述的数据处理方法，其中，

所述样本集包括：第一子样本集和第二子样本集；

所述对所述结构控制器的参数和所述门循环神经单元的参数分别进行调整包括：

根据所述第一子样本集中各个序列的下一时刻的数据和各个序列对应的所述预测模型当前时刻输出的数据，计算第一损失函数，根据所述第一损失函数对所述结构控制器的参数进行调整；

根据所述第二子样本集中各个序列的各个序列的下一时刻的数据和各个序列对应的所述预测模型当前时刻输出的数据，计算第二损失函数，根据所述第二损失函数对所述门循环神经单元的参数的参数进行调整。

11.根据权利要求10所述的数据处理方法，其中，

所述对所述结构控制器的参数和所述门循环神经单元的参数分别进行调整还包括：

判断所述第一损失函数的值是否达到预设条件；

在所述第一损失函数的值达到预设条件的情况下，根据所述结构控制器的参数，确定所述预测模型的结构。

12.根据权利要求11所述的数据处理方法，其中，

所述确定所述预测模型的结构和模型参数包括：

利用所述第二子样本集中的数据对确定结构后的所述预测模型进行训练，确定所述门循环神经单元的参数，以确定所述预测模型的模型参数。

13.根据权利要求12所述的数据处理方法，其中，

所述利用所述第二子样本集中的数据对确定结构后的所述预测模型进行训练包括：

将所述第二子样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据，输入所述确定结构后的预测模型；

利用所述门循环神经单元对所述输入数据进行运算，确定所述各个序列对应的所述确定结构后的预测模型当前时刻输出的数据；

根据所述各个序列的下一时刻的数据和所述各个序列对应的所述确定结构后的预测模型当前时刻输出的数据的差异，对所述门循环神经单元的参数进行调整。

14.根据权利要求1-5任一项所述的数据处理方法，还包括：

将待预测的序列的当前时间窗口内各个时刻的数据输入所述预测模型，得到输出的所述待预测的序列的下一时刻的预测数据。

15.一种数据处理装置，包括：在样本集中的每个序列包括：预设区域内按时间顺序排列的历史各个时刻和当前时刻的人流量数据的情况下，

样本输入模块，用于将样本集中各个序列的当前时间窗口内各个时刻的数据作为输入数据输入预测模型；其中，所述当前时间窗口至少包括当前时刻；

输出模块，用于利用所述预测模型中结构控制器和门循环神经单元对所述输入数据进行运算，确定所述各个序列对应的所述预测模型当前时刻输出的数据；

参数调整模块，用于根据所述各个序列的下一时刻的数据和所述各个序列对应的所述预测模型当前时刻输出的数据的差异，对所述结构控制器的参数和所述门循环神经单元的参数分别进行调整，以便确定所述预测模型的结构和模型参数；

16.一种数据处理装置，包括：

处理器；以及

耦接至所述处理器的存储器，用于存储指令，所述指令被所述处理器执行时，使所述处理器执行如权利要求1-14任一项所述的数据处理方法。

17.一种计算机可读非瞬时性存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现权利要求1-14任一项所述方法的步骤。

18.一种数据处理装置，包括：在样本集中的每个序列包括：预设区域内按时间顺序排列的历史各个时刻和当前时刻的车流量数据的情况下，

19.一种数据处理装置，包括：在样本集中的每个序列包括：预设区域内按时间顺序排列的历史各个时刻和当前时刻的网络流量数据的情况下，

20.一种数据处理装置，包括：在样本集中的每个序列包括：多个词语组成的句子，不同时刻的数据表示不同的词语的情况下，

21.一种数据处理装置，包括：在样本集中的每个序列包括：预设网站按时间顺序排列的历史各个时刻和当前时刻的流量或访问量的情况下，