WO2018068742A1

WO2018068742A1 - 数据处理方法和装置

Info

Publication number: WO2018068742A1
Application number: PCT/CN2017/105813
Authority: WO
Inventors: 李毅; 金涬; 张书彬; 郭志懋; 薛伟
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-10-14
Filing date: 2017-10-12
Publication date: 2018-04-19
Also published as: CN107527091A; CN107527091B; US11151451B2; US20180314944A1

Abstract

一种数据处理方法和装置。其中，该数据处理方法包括：获取输入至神经网络的第一待处理数据（S201），神经网络为待更新的模型；通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型（S202）；获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据（S203）；通过第二待处理数据中位于第二时间窗口内的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型（S204）；将第一增量模型进行线上发布（S205）。该方法解决了数据处理的模型不能快速更新的问题的技术问题。

Description

数据处理方法和装置

本申请要求于2016年10月14日提交中国专利局、申请号为201610900390.7、申请名称为“数据处理方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据处理领域，具体而言，涉及一种数据处理方法和装置。

背景技术

随着数据处理技术的发展，在数据处理中，逻辑回归模型(Logistic Regression，简称为LR)已经广泛应用于广告点击率预估。然而，由于逻辑回归模型为一种线性模型，导致其局限性在于难以学习到原始特征以及特征组合中的非线性信息。

传统方式中存在构造深度神经网络的点击率预估方法，比如，构造深度神经网络的广告点击率预估，可以从原始特征中学习非线性信息。一方面，由于在传统的机器学习框架下，深度神经网络学习的任务就是在给定充分训练数据的基础上来学习一个点击率预估模型，然后利用这个学习到的模型来在线实时预测用户对广告的点击行为；另一方面，由于互联网在线投放的数据环境本身是快速变化的，比如用户群是快速变化的，即新用户不断加入且用户会不断产生新的行为和新的兴趣点；又比如，新数据不断出现，同时旧数据也会不断下架。因此，数据处理的模型更新必须快速，才能更好地适应这种数据环境的快速变化。为了体现快速变化的数据环境，需要实现快速的模型更新，从而需要在有限的时间内完成模型的训练。

在数据处理中，模型训练是需要花费大量时间的，比如一次全量的模型训练需要在随机初始化的模型基础上，使用充分的训练数据经过多轮迭代，才能够得到充分拟合数据的收敛模型。而由于互联网中的投放数据是海量的，并且模型训练本身也需要较长的时间，因此，涉及到大量的计算会使得模型训练的时间更加漫长，故不能满足模型快速更新的需求。

针对上述数据处理的模型不能快速更新的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种数据处理方法和装置，以至少解决相关技术中数据处理的模型不能快速更新的问题的技术问题。

为了解决上述问题，第一方面，本申请实施例提供了一种数据处理方法，该数据处理方法包括：获取输入至神经网络的第一待处理数据，其中，该神经网络为待更新的模型；通过该第一待处理数据中位于的第一目标数据对该神经网络进行第一预设次数的迭代训练，得到该神经网络的种子模型，其中，该第一目标数据位于第一时间窗口内，该种子模型为该神经网络的初始化模型；获取在该第一时间窗口对应的时间之后产生的第一新增数据，并将该第一新增数据和该第一待处理数据合并为第二待处理数据；通过该第二待处理数据中的第二目标数据对该种子模型进行第二预设次数的迭代训练，得到该神经网络的第一增量模型，其中，该第二目标数据位于第二时间窗口内，该第二时间窗口与该第一时间窗口具有第一预设重叠区域；该将第一增量模型进行线上发布。

在第一方面的一种可能的实现方式中，该第二时间窗口的右边界契合当前时间。

在第一方面的一种可能的实现方式中，在将该第一增量模型进行线上发布之后，该方法还包括：

根据第一时间和该第二时间窗口确定第三时间窗口，其中，该第三时间窗口与该第二时间窗口具有第二预设重叠区域；

获取在该第二时间窗口对应的时间之后产生的第二新增数据，并将该第二新增数据和该第二待处理数据合并为第三待处理数据；

通过该第三待处理数据中的第三目标数据对该第一增量模型进行第三预设次数的迭代训练，得到该神经网络的第二增量模型，其中，该第三目标数据位于该第三时间窗口内；

将该第二增量模型进行线上发布。

在该实现方式中，在产生第二新增数据后，不需要对模型从头开始训练，而是将第二新增数据和所述第二待处理数据合并为第三待处理数据，接着利用第三待处理数据中的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型，从而大大加快了线上模型的更新速度，能更快地反应用户行为变化和新数据上线的影响。

在第一方面的一种可能的实现方式中，该第三时间窗口的右边界契合该第一时间。

在第一方面的一种可能的实现方式中，该根据第一时间和该第二时间窗口确定第三时间窗口，包括：

判断是否有用于推送新模型的指示信息，其中，该新模型包括该第二增量模型；

如果判断出有该指示信息，则将该第一时间确定为该第三时间窗口的右边界；

滑动该第二时间窗口至该第三时间窗口的右边界，并将该第三时间窗口的右边界向前推移该第三时间窗口的长度，得到该第三时间窗口的左边界；

根据该第三时间窗口的右边界和该第三时间窗口的左边界确定该第三时间窗口。

按照预设周期判断该第一增量模型中是否存在失效数据，其中，该失效数据为停止推送的第一待处理数据；

如果按照该预设周期判断出该第一增量模型中存在该失效数据，则从该第一增量模型中清除该失效数据，得到更新增量模型；

将该更新增量模型进行线上发布。

在该实现方式中，通过按照预设周期判断出第一增量模型中存在失效数据，然后从第一增量模型中清除失效数据，得到不存在失效数据的更新增量模型，接着将该更新增量模型进行线上发布，从而使模型保持合理的大小，避免模型的尺寸不断膨胀，且投放毫无意义的数据，进而实现了快速更新数据处理的模型的技术效果。

在第一方面的一种可能的实现方式中，该从该第一增量模型中清除该失效数据，得到该更新增量模型，包括：

将该第二时间窗口扩大预设倍数，得到第四时间窗口；

获取该第一增量模型中的第二待处理数据，将该第二待处理数据作为该失效数据，其中，该第二待处理数据不在该第四时间窗口内；从该第一增量模型中清除该失效数据，得到该更新增量模型。

在第一方面的一种可能的实现方式中，在推送该更新增量模型上线之后，该方法还包括：

根据第二时间和第四时间窗口确定第五时间窗口，其中，该第五时间窗口与该第四时间窗口具有第三预设重叠区域；

获取在该第四时间窗口对应的时间之后产生的第三新增数据，并将该第三新增数据和该第二待处理数据合并为第四待处理数据；

通过该第四待处理数据中的第四目标数据对该更新增量模型进行第四预设次数的迭代训练，得到该神经网络的第三增量模型，其中，该第四目标数据位于该第五时间窗口内；

将该第三增量模型进行线上发布。

在第一方面的一种可能的实现方式中，该第五时间窗口的右边界契合该第二时间。

在第一方面的一种可能的实现方式中，在通过该第二目标数据对该种子模型进行第二预设次数的迭代训练，得到该神经网络的第一增量模型之后，该方法还包括：

通过该第一增量模型对历史数据进行拟合，得到拟合结果，其中，该历史数据为处理过的待处理数据；

通过该第一增量模型携带该拟合结果。

该实现方式中，通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，再利用第一增量模型对历史数据进行拟合，得到拟合结果，并将第一增量模型携带拟合结果，实现了模型增量式训练使得模型中永远携带有对所有历史数据的拟合状态，达到了提高拟合预估准确性的效果。

在第一方面的一种可能的实现方式中，该通过该第一待处理数据中的第一目标数据对该神经网络进行第一预设次数的迭代训练，包括：

在冷启动状态下，对该神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，该冷启动状态为对该神经网络进行首次处理时的状态；

通过该第一目标数据和该初始化参数，对该神经网络进行该第一预设次数的迭代训练，得到该神经网络的种子模型。

在第一方面的一种可能的实现方式中，该对该神经网络的各层参数进行随机初始化处理，包括但不限于以下方法之一：

对该神经网络的各层参数分别进行按某常数初始化处理；

对该神经网络的各层参数进行平均分布随机初始化处理；

对该神经网络的各层参数进行高斯分布随机初始化处理；

对该神经网络的各层参数进行Xavier初始化处理。

在第一方面的一种可能的实现方式中，该方法应用于预设场景下，该预设场景包括但不限于以下之一：

媒体文件的CTR预估场景；

图像识别模型的训练场景；

语音识别模型的训练场景；

自然语言理解模型的训练场景。

在第一方面的一种可能的实现方式中，该第二预设次数小于或等于该第一预设次数。

在第一方面的一种可能的实现方式中，该第三预设次数小于或等于该第一预设次数。

在第一方面的一种可能的实现方式中，该第四预设次数小于或等于该第一预设次数。

第二方面，本申请实施例提供了一种数据处理装置，该数据处理装置包括：第一获取单元，用于获取输入至神经网络的第一待处理数据，其中，该神经网络为待更新的模型；第一迭代单元，用于通过该第一待处理数据中的第一目标数据对该神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，该第一目标数据位于第一时间窗口内，该种子模型为该神经网络的初始化模型；第二获取单元，用于获取在该第一时间窗口对应的时间之后产生的第一新增数据，并将该第一新增数据和该第一待处理数据合并为第二待处理数据；第二迭代单元，用于通过该第一待处理数据中的第二目标数据对该种子模型进行第二预设次数的迭代训练，得到该神经网络的第一增量模型，其中，该第二目标数据位于第二时间窗口内，该第二时间窗口与该第一时间窗口具有第一预设重叠区域；第一发布单元，用于将该第一增量模型进行线上发布。

在第二方面的一种可能的实现方式中，该第二时间窗口的右边界契合当前时间。

在第二方面的一种可能的实现方式中，该装置还包括：

第一确定单元，用于在将该第一增量模型进行线上发布之后，根据第一时间和该第二时间窗口确定第三时间窗口，其中，该第三时间窗口与该第二时间窗口具有第二预设重叠区域；

第三获取单元，用于获取在该第二时间窗口对应的时间之后产生的第二新增数据，并将该第二新增数据和该第二待处理数据合并为第三待处理数据；

第三迭代单元，用于通过该第三待处理数据中的第三目标数据对该第一增量模型进行第三预设次数的迭代训练，得到该神经网络的第二增量模型，其中，该第三目标数据位于该第三时间窗口内；

第二发布单元，用于将该第二增量模型进行线上发布。

在第二方面的一种可能的实现方式中，该第三时间窗口的右边界契合该第一时间。

在第二方面的一种可能的实现方式中，该第一确定单元包括：

判断模块，用于判断是否有用于推送新模型的指示信息，其中，该新模型包括该第二增量模型；

确定模块，用于在判断出有该指示信息时，将该第一时间确定为该第三时间窗口的右边界，滑动该第二时间窗口至该第三时间窗口的右边界，并将该第三时间窗口的右边界向前推移该第三时间窗口的长度，得到该第三时间窗口的左边界，根据该第三时间窗口的右边界和该第三时间窗口的左边界确定该第三时间窗口。

在第二方面的一种可能的实现方式中，该装置还包括：

判断单元，用于在将该第一增量模型进行线上发布之后，按照预设周期判断该第一增量模型中是否存在失效数据，其中，该失效数据为停止推送的第一待处理数据；

清除单元，用于在按照该预设周期判断出该第一增量模型中存在该失效数据，从该第一增量模型中清除该失效数据，得到更新增量模型；

第三发布单元，用于将该更新增量模型进行线上发布。

在第二方面的一种可能的实现方式中，该清除单元包括：

扩大模块，用于将该第二时间窗口扩大预设倍数，得到第四时间窗口；

获取模块，用于获取该第一增量模型中的第二待处理数据，将该第二待处理数据作为该失效数据，其中，该第二待处理数据不在该第四时间窗口内；

清除模块，用于从该第一增量模型中清除该失效数据，得到该更新增量模型。

在第二方面的一种可能的实现方式中，该装置还包括：

第二确定单元，用于根据第二时间和第四时间窗口确定第五时间窗口，其中，该第五时间窗口与该第四时间窗口具有第三预设重叠区域；

第四获取单元，用于获取在该第四时间窗口对应的时间之后产生的第三新增数据，并将该第三新增数据和该第二待处理数据合并为第四待处理数据；

第四迭代单元，用于通过该第四待处理数据中的第四目标数据对该更新增量模型进行第四预设次数的迭代训练，得到该神经网络的第三增量模型，其中，该第四目标数据位于该第五时间窗口内；

第四发布单元，用于将该第三增量模型进行线上发布。

在第二方面的一种可能的实现方式中，该第五时间窗口的右边界契合该第二时间。

在第二方面的一种可能的实现方式中，该装置还包括：

拟合单元，用于通过该第一增量模型对历史数据进行拟合，得到拟合结果，其中，该历史数据为处理过的待处理数据；

携带单元，用于通过该第一增量模型携带该拟合结果。

在第二方面的一种可能的实现方式中，该第一迭代单元包括：

处理模块，用于在冷启动状态下，对该神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，该冷启动状态为对该神经网络进行首次处理时的状态；

迭代模块，用于通过该第一目标数据和该初始化参数，对该神经网络进行该第一预设次数的迭代训练，得到该神经网络的种子模型。

在第二方面的一种可能的实现方式中，该对该神经网络的各层参数进行随机初始化处理，包括但不限于以下方法之一：

对该神经网络的各层参数分别进行按某常数初始化处理；

对该神经网络的各层参数进行平均分布随机初始化处理；

对该神经网络的各层参数进行高斯分布随机初始化处理；

对该神经网络的各层参数进行Xavier初始化处理。

在第二方面的一种可能的实现方式中，该装置应用于预设场景下，该预设场景包括但不限于以下之一：

媒体文件的CTR预估场景；

图像识别模型的训练场景；

语音识别模型的训练场景；

自然语言理解模型的训练场景。

在第二方面的一种可能的实现方式中，该第二预设次数小于或等于该第一预设次数。

在第二方面的一种可能的实现方式中，该第三预设次数小于或等于该第一预设次数。

在第二方面的一种可能的实现方式中，该第四预设次数小于或等于该第一预设次数。

第二方面中各个部分可能的实现方式的有益效果，参见第一方面中与之对应的方法的有益效果。

第三方面，本申请实施例提供了一种数据处理终端，所述终端包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行权利要求1-16任一项所述的数据处理方法。

第四方面，本申请实施例提供了一种存储介质，其特征在于，所述存储介质用于存储程序代码，所述程序代码用于执行权利要求1-16任一项所述的数据处理方法。

第五方面，本申请实施例提供了一种包括指令的计算机程序产品，其特征在于，当其在计算机上运行时，使得所述计算机执行权利要求1-16任一项所述的数据处理方法。

第六方面，本申请实施例提供了一种数据处理方法，包括：

数据处理设备获取输入至神经网络的第一待处理数据，其中，该神经网络为待更新的模型；

该数据处理设备通过该第一待处理数据中的第一目标数据对该神经网络进行第一预设次数的迭代训练，得到该神经网络的种子模型，其中，该第一目标数据位于第一时间窗口内，该种子模型为该神经网络的初始化模型；

该数据处理设备获取在该第一时间窗口对应的时间之后产生的第一新增数据，并将该第一新增数据和该第一待处理数据合并为第二待处理数据；

该数据处理设备通过该第二待处理数据中的第二目标数据对该种子模型进行第二预设次数的迭代训练，得到该神经网络的第一增量模型，其中，该第二目标数据位于第二时间窗口内，该第二时间窗口与该第一时间窗口具有第一预设重叠区域；

该数据处理设备将该第一增量模型进行线上发布。

在第六方面的一种可能的实现方式中，该第二时间窗口的右边界契合当前时间。

在第六方面的一种可能的实现方式中，在将该第一增量模型进行线上发布之后，该方法还包括：

该数据处理设备根据第一时间和该第二时间窗口确定第三时间窗口，其中，该第三时间窗口与该第二时间窗口具有第二预设重叠区域；

该数据处理设备获取在该第二时间窗口对应的时间之后产生的第二新增数据，并将该第二新增数据和该第二待处理数据合并为第三待处理数据；

该数据处理设备通过该第三待处理数据中的第三目标数据对该第一增量模型进行第三预设次数的迭代训练，得到该神经网络的第二增量模型，其中，该第三目标数据位于该第三时间窗口内；

该数据处理设备将该第二增量模型进行线上发布。

在第六方面的一种可能的实现方式中，该第三时间窗口的右边界契合该第一时间。

在第六方面的一种可能的实现方式中，该数据处理设备根据第一时间和该第二时间窗口确定第三时间窗口，包括：

该数据处理设备判断是否有用于推送新模型的指示信息，其中，该新模型包括该第二增量模型；

如果判断出有该指示信息，则该数据处理设备将该第一时间确定为该第三时间窗口的右边界；

该数据处理设备滑动该第二时间窗口至该第三时间窗口的右边界，并将该第三时间窗口的右边界向前推移该第三时间窗口的长度，得到该第三时间窗口的左边界；

该数据处理设备根据该第三时间窗口的右边界和该第三时间窗口的左边界确定该第三时间窗口。

在第六方面的一种可能的实现方式中，在该数据处理设备将该第一增量模型进行线上发布之后，该方法还包括：

该数据处理设备按照预设周期判断该第一增量模型中是否存在失效数据，其中，该失效数据为停止推送的第一待处理数据；

如果按照该预设周期判断出该第一增量模型中存在该失效数据，则该数据处理设备从该第一增量模型中清除该失效数据，得到更新增量模型；

该数据处理设备将该更新增量模型进行线上发布。

在第六方面的一种可能的实现方式中，该数据处理设备从该第一增量模型中清除该失效数据，得到该更新增量模型，包括：

该数据处理设备将该第二时间窗口扩大预设倍数，得到第四时间窗口；

该数据处理设备获取该第一增量模型中的第二待处理数据，将该第二待处理数据作为该失效数据，其中，该第二待处理数据不在该第四时间窗口内；从该第一增量模型中清除该失效数据，得到该更新增量模型。

在第六方面的一种可能的实现方式中，在该数据处理设备推送该更新增量模型上线之后，该方法还包括：

该数据处理设备根据第二时间和第四时间窗口确定第五时间窗口，其中，该第五时间窗口与该第四时间窗口具有第三预设重叠区域；

该数据处理设备获取在该第四时间窗口对应的时间之后产生的第三新增数据，并将该第三新增数据和该第二待处理数据合并为第四待处理数据；

该数据处理设备通过该第四待处理数据中的第四目标数据对该更新增量模型进行第四预设次数的迭代训练，得到该神经网络的第三增量模型，其中，该第四目标数据位于该第五时间窗口内；

该数据处理设备将该第三增量模型进行线上发布。

在第六方面的一种可能的实现方式中，该第五时间窗口的右边界契合该第二时间。

在第六方面的一种可能的实现方式中，在该数据处理设备通过该第二目标数据对该种子模型进行第二预设次数的迭代训练，得到该神经网络的第一增量模型之后，该方法还包括：

该数据处理设备通过该第一增量模型对历史数据进行拟合，得到拟合结果，其中，该历史数据为处理过的待处理数据；

该数据处理设备通过该第一增量模型携带该拟合结果。

在第六方面的一种可能的实现方式中，该数据处理设备通过该第一待处理数据中的第一目标数据对该神经网络进行第一预设次数的迭代训练，包括：

在冷启动状态下，该数据处理设备对该神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，该冷启动状态为对该神经网络进行首次处理时的状态；

该数据处理设备通过该第一目标数据和该初始化参数，对该神经网络进行该第一预设次数的迭代训练，得到该神经网络的种子模型。

在第六方面的一种可能的实现方式中，该数据处理设备对该神经网络的各层参数进行随机初始化处理，包括但不限于以下方法之一：

对该神经网络的各层参数分别进行按某常数初始化处理；

该数据处理设备对该神经网络的各层参数进行平均分布随机初始化处理；

该数据处理设备对该神经网络的各层参数进行高斯分布随机初始化处理；

该数据处理设备对该神经网络的各层参数进行Xavier初始化处理。

在第六方面的一种可能的实现方式中，该方法应用于预设场景下，该预设场景包括以下之一：

媒体文件的CTR预估场景；

图像识别模型的训练场景；

语音识别模型的训练场景；

自然语言理解模型的训练场景。

在第六方面的一种可能的实现方式中，该第二预设次数小于或等于该第一预设次数。

在第六方面的一种可能的实现方式中，该第三预设次数小于或等于该第一预设次数。

在第六方面的一种可能的实现方式中，该第四预设次数小于或等于该第一预设次数。

第六方面中各个部分可能的实现方式的有益效果，参见第一方面中与之对应的方法的有益效果。

在本申请实施例中，获取输入至神经网络的第一待处理数据，其中，神经网络为待更新的模型；通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，种子模型为神经网络的初始化模型；获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据；通过第二待处理数据中位于第二时间窗口内的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型，其中，第二时间窗口与第一时间窗口具有第一预设重叠区域；将第一增量模型进行线上发布的方式。这样，对于数据处理的模型的更新训练，在产生新增数据后，不需要从头开始训练模型，而是直接在种子模型的基础上，利用包括了新增数据的目标数据对种子模型进行预设次数的迭代训练，得到神经网络的增量模型，并将增量模型进行线上发布，从而达到了对增量模型进行更新、发布的目的，进而实现了快速更新数据处理模型的技术效果，故解决了数据处理的模型不能快速更新的问题。

附图说明

图1所示为根据本申请实施例的数据处理方法的硬件环境的示意图；

图2所示为根据本申请实施例的数据处理方法的一种流程图；

图3所示为根据本申请实施例的数据处理方法的另一种流程图；

图4所示为根据本申请实施例的根据第一时间和第二时间窗口确定第三时间窗口的方法的流程图；

图5所示为根据本申请实施例的数据处理方法的另一种流程图；

图6所示为根据本申请实施例的从第一增量模型中清除失效数据的方法的流程图；

图7所示为根据本申请实施例的数据处理方法的另一种流程图；

图8所示为根据本申请实施例的数据处理方法的另一种流程图；

图9是所示为根据本申请实施例的通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练的方法的流程图；

图10所示为根据本申请实施例的深度神经网络的全连接结构的示意图；

图11所示为根据本申请实施例的数据处理方法的另一种流程图；

图12所示为根据本申请实施例的定期清除失效键的示意图；

图13所示为根据本申请实施例的数据处理装置的一种示意图；

图14所示为根据本申请实施例的另一种数据处理装置的另一种示意图；

图15所示为根据本申请实施例的另一种数据处理装置的另一种示意图；

图16所示为根据本申请实施例的另一种数据处理装置的另一种示意图；

图17所示为根据本申请实施例的另一种数据处理装置的另一种示意图；

图18所示为根据本申请实施例的一种终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为解决传统数据处理方式中，数据处理的模型不能快速更新的问题，需要考虑一种有效的数据处理方法。故此，本申请实施例提供了一种数据处理方法及装置，以希望可以达到对增量模型进行更新的目的，并实现快速更新数据处理的模型的技术效果，从而解决数据处理的模型不能快速更新的问题。

在本申请实施例中，数据处理的模型可以通过学习来拟合历史曝光数据，且具有在未来一段时间内对数据点击的点击率进行预估的作用，比如，数据处理中的广告点击率预估模型，具有在未来一段的时间内预估广告点击率的作用。

因此，本申请实施例所提供的数据处理方法可以应用于预设场景下，在该预设场景中，点击流数据的产生极为迅猛，每天可以产生大量的曝光数据，比如，在媒体文件的点击通过率(Click-Through-Rate，简称为CTR)预估场景下，每天会有大量的用户通过点击不同的媒体文件，进行文件查阅，又比如，在互联网广告场景下，每天产生大量广告曝光数据，由于广告曝光数据包含了广告内容、用户内容以及时间等上下文特征，故广告曝光数据是具有价值的标注数据，其中，可以通过用户是否点击一数据判断该数据是否为标注数据。

一方面，由于用户行为和互联网上数据处理的素材是时刻变化的，相应地，用于预估点击率的模型需要快速更新，另一方面，由于要求点击率预估模型通过拟合海量的历史数据，以学习用户点击行为模式的不变特性，因此，对于数据处理的模型的更新训练，如果每次都丢弃之前训练好的模型，而对模型从头开始训练，将是十分浪费的，例如，如果已经训练得到了足够拟合上一批历史数据(记作D)的模型M，经过一段时间后则要对这段时间内产生的新数据D’进行学习，在需要训练得到新模型(既有对数据D又有对数据D’的拟合)的需求中，完全丢弃这个模型M是非常浪费的。

故此，本申请实施例中，可以采用增量更新方法训练数据处理的模型，比如，采用增量更新方法训练广告点击率预估模型。这样，对于数据处理的模型的更新训练，不需要对模型从头开始训练，而是在需要训练得到新模型时，采用增量更新方法训练数据处理的模型，从而达到对增量模型进行更新的目的，进而实现快速更新数据处理的模型的技术效果。

举例说明，本申请实施例可以应用到如图1所示的硬件环境中。图1是根据本申请实施例的数据处理方法的硬件环境的示意图，在该硬件环境中，至少包括服务器101和终端102。如图1所示，服务器101可以通过网络与终端102进行通信连接，其中，该网络可以为广域网、城域网或局域网，当然，还可以是其它类型的网络，这里对于网络的类型不进行任何限定。

在该硬件环境中，该终端102可以理解为用户终端，该用户终端可以为智能手机、平板电脑、电子书阅读器、动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III，简称为MP3)播放器、动态影像专家压缩标准音频层面4(Moving Picture Experts Group Audio Layer IV，简称为MP4)播放器、膝上型便携计算机和台式计算机等等。

需要说明的是，本申请实施例的数据处理方法可以由服务器101来执行，也可以由终端102来执行，还可以是由服务器101和终端102共同执行，其中，当终端102执行本申请实施例的数据处理方法时，也可以是由安装在其上的客户端来执行。在这里不对本申请实施例的执行主体进行任何限定，只要是具有数据处理能力的数据处理设备均可。

实施例1

接下来，结合图2来说明本申请实施例如何实现数据处理。

图2是根据本申请实施例的一种数据处理方法的流程图。如图2所示，该数据处理方法可以包括以下步骤：

S201，获取输入至神经网络的第一待处理数据，其中，神经网络为待更新的模型。

神经网络中输入的第一待处理数据可以为训练数据，由于该训练数据中包括了曝光日志，因此，该第一待处理数据中至少可以包括独热编码(One-Hot Encoding)向量，其中，该独热编码向量是根据曝光日志中的用户特征和数据的特征组合经过离散化处理后得到的。

例如，在媒体文件的CTR预估场景下，当该CTR预估场景为互联网广告场景时，深度神经网络输入的第一待处理数据可以包括独热编码向量，该独热编码向量是根据每条广告曝光日志中的用户特征和广告特征组合经过离散化处理后得到的，且适用于广告点击率预估场景的深度学习。

在该实施例中，独热编码作为一种对属性类分段特征的处理方法，对于每一个特征而言，如果该特征有M个可能值，那么该特征经过独热编码处理后，就会变成M个(0-1)二元特征。由于这些二元特征互斥，每次只可以有一个二元特征被激活，其中，若被激活则可能值为1，若未被激活则可能值为0，因此，经过独热编码处理后，数据会变成稀疏的。

该神经网络为待更新的模型，例如该神经网络可以为待更新的深度神经网络。深度神经网络由神经元组成，具体地，该深度神经网络可以由具有两个隐藏层的多层感知器(Multi-Layer Perceptron，简称为MLP)神经网络的神经元连接组成。由于深度神经网络包括了某输入向量中的非零元，使得在神经网络训练的每一次反向传播计算中，均需要神经元参与，因此，深度神经网络比一般的神经网络更为复杂。

S202，通过第一待处理数据中的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，该第一目标数据位于第一时间窗口内，该种子模型为该神经网络的初始化模型。

在获取输入至神经网络的第一待处理数据之后，可以对数据处理的模型进行初始化，进一步地，可以对数据处理的模型进行随机初始化。

在冷启动状态下，以当前时间倒溯，可以确定出第一时间窗口，该第一时间窗口也即滑动数据窗口，为冷启动训练时的固定数据窗口。其中，冷启动状态为对神经网络进行首次处理时的状态，为一种软件启动状态，比如，可以为故障恢复之后的处理状态。

具体地，第一目标数据的时间跨度可以为(当前时间减去第一时间窗口对应的时间，当前时间)，通过第一待处理数据中位于第一时间窗口内的第一目标数据，可以对神经网络进行第一预设次数的迭代训练，从而得到神经网络的种子模型，其中，该第一预设次数为通过该第一目标数据对神经网络进行迭代的迭代次数，且每一次迭代训练都有学习步长。

该种子模型为神经网络的初始化模型，暂时不进行线上发布，并且，该种子模型也为用于启动模型增量更新训练的首个模型，可以通过冷启动、随机初始化，使用一定时间窗口数据，进行多轮迭代训练得到。当然，除了上述实现方式以外，还可以通过使用第一时间窗口内的点击曝光数据训练模型一个迭代，得到神经网络的种子模型。

S203，获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据。

在通过第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型之后，随着时间的推移，若在第一时间窗口对应的时间之后产生第一新增数据，则可以获取该第一新增数据，并将第一新增数据和第一待处理数据合并得到第二待处理数据，该第二待处理数据为接下来处理的数据对象。

S204，通过第二待处理数据中位于第二时间窗口内的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型，其中，第二时间窗口与第一时间窗口具有第一预设重叠区域，第二预设次数小于等于第一预设次数。

在通过第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型之后，对种子模型以增量更新的方式训练新的模型，也即，对种子模型进行一次增量更新训练。

在本实施例中，可以通过第一时间窗口得到第二时间窗口，例如，可以基于种子模型，通过滑动第一时间窗口，使滑动后的第一时间窗口的右边界契合当前时间，此时，可以将该滑动后的第一时间窗口的右边界作为第二时间窗口的右边界，即第二时间窗口的右边界可以契合当前时间。然后，获取第二时间窗口的长度，接着，将第二时间窗口的右边界向前推移第二时间窗口的长度，得到第二时间窗口的左边界。在得到第二时间窗口的左、右边界后，即可得到第二时间窗口。

在得到第二时间窗口之后，可以通过第二时间窗口内的第二目标数据训练模型第二预设次数迭代，得到第一增量模型，该第一增量模型可以在推送上线时预估数据的点击率，其中，每一次迭代训练都有学习步长。在一种实施方式中，该第二预设次数可以小于或等于第一预设次数。当然，除了上述实现方式以外，可选地，还可以使用第二时间窗口内的广告点击曝光数据训练模型第二预设次数迭代，得到第一增量模型，该第一增量模型可以在推送上线时预估广告点击率。

需要说明的是，在本申请实施例中，第二时间窗口的长度与第一时间窗口的长度可以相同，也可以不同，在这里不对第二时间窗口的长度做任何限定。

例如，当上述第一时间窗口的时间长度与第二时间窗口的长度相同时。假设第一时间窗口的长度与第二时间窗口的长度都为23小时，第一时间窗口的左边界为一天的00:00，第一时间窗口的右边界为当天的23:00，且当前时间为23:10。由于第一时间窗口的右边界和当前时间相差10分钟，因此，需要将第一时间窗口向右滑动10分钟，得到第二时间窗口的左边界为当天的00:10，第二时间窗口的右边界为当天的23:10(也即，当前时间)，从而实现根据当前时间和第一时间窗口确定第二时间窗口的目的。

例如，当上述第一时间窗口的时间长度与第二时间窗口的长度不同时。假设第一时间窗口的长度为23小时，第一时间窗口的左边界为一天的00:00，第一时间窗口的右边界为当天的23:00，第二时间窗口的长度为22小时，且当前时间为23:10。由于第一时间窗口的右边界和当前时间相差10分钟，因此，需要将第一时间窗口的右边界向右滑动10分钟，得到第二时间窗口的右边界为当天的23:10(也即，当前时间)，第二时间窗口的左边界为第二时间窗口的右边界向前推移22小时，也即，第二时间窗口的左边界为当天的01:10，从而实现根据当前时间和第一时间窗口确定第二时间窗口的目的。

S205，将第一增量模型进行线上发布。

在通过第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，将第一增量模型进行线上发布，也即，将第一增量模型推送上线，用于预估数据的点击率，直至下次新模型推送。

需要说明的是，第一增量模型在更新训练的过程中，应适当减少模型学习步长，以避免一些训练好的权重离开最优点。因此，在本实施例一种可能的实现方式中，学习步长应小于等于种子模型训练阶段最后一个迭代所用的学习步长。

由于对数据处理的模型采用增量更新训练的方式，并且每次需要训练的迭代次数小于或等于固定数据窗口所需的迭代次数，因此大大加快了线上模型的更新速度，能更快地反应用户行为变化和新数据上线的影响。另外，由于模型可以记忆更持久的用户信息和数据信息，因此，对于数据长期投放的行为和用户点击行为拟合更加准确。

需要说明的是，当增量模型以成百上千的数量增加时，深度神经网络具备更强的表达能力，对数据非线性特征的拟合能力更强，对增量模型的多个权重的处理能力更强，从而可以更准确地预估CTR，进而可以提升预估广告点击率的能力，上述技术方案优选适用于对深度神经网络中的第一待处理数据进行处理的方法。

通过上述S201至S205，可以实现通过获取输入至神经网络的第一待处理数据，其中，神经网络为待更新的模型；通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，种子模型为神经网络的初始化模型；获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据；通过第二待处理数据中位于第二时间窗口内的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型，其中，第二时间窗口与第一时间窗口具有第一预设重叠区域。在一种实施方式中，第二预设次数可以小于或等于第一预设次数；将第一增量模型进行线上发布，从而可以解决数据处理的模型不能快速更新的问题，进而达到了快速更新数据处理的模型的技术效果。

上述实施例得到神经网络的种子模型以及第一增量模型后，为避免模型从头训练带来的时间开销，达到快速更新数据处理中的模型的目的，作为一种可选的实施例，在将第一增量模型进行线上发布之后，根据第一时间和第二时间窗口确定第三时间窗口，通过第三待处理数据中位于第三时间窗口内的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型，将第二增量模型进行线上发布。接下来，将结合图3对该实施方式进行具体说明。

图3是根据本申请实施例的另一种数据处理方法的流程图。如图3所示，该数据处理方法还包括以下步骤：

S301，根据第一时间和第二时间窗口确定第三时间窗口。

在本申请上述S301提供的技术方案中，在将第一增量模型进行线上发布之后，根据第一时间和第二时间窗口确定第三时间窗口，其中，第三时间窗口与第二时间窗口具有第二预设重叠区域。

具体地，在将第一增量模型进行线上发布之后，对数据处理中的模型进行第二次增量更新训练。基于第一增量模型，滑动第二时间窗口，使滑动后的第二时间窗口的右边界契合第一时间，并以第一时间确定为第三时间窗口的右边界，即第三时间窗口的右边界契合第一时间，从而得到第三时间窗口，该第三时间窗口与第二时间窗口具有时间上的重叠区域。需要强调的是，第一时间可以为任意时间，当然，也可以理解为第二增量更新训练时所对应的当前时间。

需要说明的是，本申请实施例中，根据第一时间和第二时间窗口确定第三时间窗口的具体实现方式将在后面进行详细说明。

S302，获取在第二时间窗口对应的时间之后产生的第二新增数据，并将第二新增数据和第二待处理数据合并为第三待处理数据。

在本申请上述S302提供的技术方案中，随着时间的推移，在第二时间窗口对应的时间之后产生第二新增数据，获取第二新增数据，并将第二新增数据和第二待处理数据合并为第三待处理数据，该第三待处理数据为接下来处理的数据对象。

S303，通过第三待处理数据中位于第三时间窗口内的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型，其中，第三目标数据位于所述第三时间窗口内。

在本申请上述S303提供的技术方案中，在根据第一时间和第二时间窗口确定第三时间窗口之后，对第一增量模型以增量更新的方式训练新的模型，也即，对第一增量模型进行一次增量更新训练。通过第三时间窗口内的第三目标数据训练模型第三预设次数迭代，得到第二增量模型，该第二增量模型可以在推送上线时预估数据的点击率，其中，每一次迭代训练都有学习步长。在一种实施方式中，该第三预设次数可以小于或等于第一预设次数。当然，除了上述实现方式以外，可选地，还可以使用第三时间窗口内的广告点击曝光数据训练模型第三预设次数迭代，得到第二增量模型，该第二增量模型可以在推送上线时预估广告点击率。

该实施例可以用于基于海量数据训练用于广告点击率预估的深度学习模型时，避免模型从头训练带来的时间开销，达到了模型快速更新的目的。

S304，将第二增量模型进行线上发布。

在通过第三目标数据对种子模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型之后，将第二增量模型进行线上发布，也即，将第二增量模型推送上线，用于预估数据的点击率，直至下次新模型推送。

需要说明的是，第二增量模型在更新训练的过程中，应适当减少模型学习步长，以避免一些训练好的权重离开最优点。因此，在本实施例一种可能的实现方式中，学习步长应小于等于种子模型训练阶段最后一个迭代所用的学习步长。

由于对于数据处理的模型的更新训练，在产生第二新增数据后，不需要对模型从头开始训练，而是将第二新增数据和所述第二待处理数据合并为第三待处理数据，接着利用第三待处理数据中的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型，并且每次需要训练的迭代次数小于或等于固定数据窗口所需的迭代次数，因此大大加快了线上模型的更新速度，能更快地反应用户行为变化和新数据上线的影响。另外，由于模型可以记忆更持久的用户信息和数据信息，因此，对于数据长期投放的行为和用户点击行为拟合更加准确。

该实施例通过在将第一增量模型进行线上发布之后，根据第一时间和第二时间窗口确定第三时间窗口，其中，第三时间窗口与第二时间窗口具有第二预设重叠区域；获取在第二时间窗口对应的时间之后产生的第二新增数据，并将第二新增数据和第二待处理数据合并为第三待处理数据；通过第三待处理数据中位于第三时间窗口内的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型；将第二增量模型进行线上发布，实现了对数据处理中的模型的更新，达到了快速更新数据处理中的模型的效果。

作为一种可选的实施例，S301中的“根据第一时间和第二时间窗口确定第三时间窗口”的步骤，可以包括：在判断出有用于推送新模型的指示信息的情况下，将第一时间确定为第三时间窗口的右边界，滑动第二时间窗口至第三时间窗口的右边界，并将第三时间窗口的右边界向前推移第三时间窗口的长度，得到第三时间窗口的左边界，根据第三时间窗口的右边界和第三时间窗口的左边界确定第三时间窗口。

接下来，结合图4来说明本申请实施例中如何根据第一时间和第二时间窗口确定第三时间窗口。

图4是根据本申请实施例的一种根据第一时间和第二时间窗口确定第三时间窗口的方法的流程图。如图4所示，该一种根据第一时间和第二时间窗口确定第三时间窗口的方法包括以下步骤：

S401，判断是否有用于推送新模型的指示信息，其中，新模型包括第二增量模型。

在将第一增量模型进行线上发布之后，需要对是否有用于推送新模型的指示信息进行判断，其中，该新模型包括第二增量模型，即需要判断是否有用于推送第二增量模型的指示信息。

S402，将第一时间确定为第三时间窗口的右边界，滑动第二时间窗口至第三时间窗口的右边界，并将第三时间窗口的右边界向前推移第三时间窗口的长度，得到第三时间窗口的左边界，根据第三时间窗口的右边界和第三时间窗口的左边界确定第三时间窗口。

在本申请上述S402提供的技术方案中，如果通过S401判断出有用于推送新模型的指示信息，则可以将第一时间确定为第三时间窗口的右边界，具体地，可以通过滑动第二时间窗口至第一时间，使滑动后的第二时间窗口的右边界契合第一时间，从而得到第三时间窗口的右边界。接着，将第三时间窗口的右边界向前推移第三时间窗口的长度，便可以得到该第三时间窗口的左边界，从而可以根据第三时间窗口的右边界和第三时间窗口的左边界确定出第三时间窗口。

具体地，在通过S401判断是否有用于推送新模型的指示信息之后，如果判断出有指示信息，则对数据处理的模型进行第二次增量更新训练。基于第一增量模型，可以滑动第二时间窗口，使滑动后的第二时间窗口的右边界契合第一时间，该滑动后的第二时间窗口的右边界即为第三时间窗口的右边界。然后，获取第三时间窗口的长度，接着，将第三时间窗口的右边界向前推移第三时间窗口的长度，得到第三时间窗口的左边界。在得到第三时间窗口的左、右边界后，即可根据第三时间窗口的右边界和左边界确定第三时间窗口。

需要说明的是，在本申请实施例中，第三时间窗口的长度与第二时间窗口的长度可以相同，也可以不同，在这里不对第三时间窗口的长度做任何限定。

例如，当上述第二时间窗口的时间长度与第三时间窗口的长度相同时。假设第二时间窗口的长度与第三时间窗口的长度都为23小时，第二时间窗口的左边界为一天的00:00，第二时间窗口的右边界为当天的23:00，且第一时间为23:10。由于第二时间窗口的右边界和第一时间相差10分钟，因此，需要将第二时间窗口向右滑动10分钟，得到第三时间窗口的左边界为当天的00:10，第三时间窗口的右边界为当天的23:10(也即，第一时间)，从而实现根据第一时间和第二时间窗口确定第三时间窗口的目的。

例如，当上述第二时间窗口的时间长度与第三时间窗口的长度不同时。假设第二时间窗口的长度为23小时，第二时间窗口的左边界为一天的00:00，第二时间窗口的右边界为当天的23:00，第三时间窗口的长度为22小时，且第一时间为23:10。由于第二时间窗口的右边界和第一时间相差10分钟，因此，需要将第二时间窗口的右边界向右滑动10分钟，得到第三时间窗口的右边界为当天的23:10(也即，第一时间)，第三时间窗口的左边界为第三时间窗口的右边界向前推移22小时，也即，第三时间窗口的左边界为当天的01:10，从而实现根据第一时间和第二时间窗口确定第三时间窗口的目的。

该实施例通过判断是否有用于推送新模型的指示信息，其中，新模型包括第二增量模型；如果判断出有指示信息，将第一时间确定为第三时间窗口的右边界，滑动第二时间窗口至第三时间窗口的右边界，将第三时间窗口的右边界向前推移第三时间窗口的长度，得到第三时间窗口的左边界，根据第三时间窗口的右边界和第三时间窗口的左边界确定第三时间窗口，实现了根据第一时间和第二时间窗口确定第三时间窗口的目的。

由于通过训练得到了神经网络的种子模型之后，每次均以增量更新的方法来训练新模型，这样，会导致随着时间的推移，更新的增量将不断积累，使得模型尺寸不断膨胀，占用较大的存储空间。并且，在数据的应用场景中，每个数据都有一定的生命期，在数据投放的时间超过预定的投放时间时，数据将下架停止投放，此类数据将成为失效数据，此后再去预估下架的数据是毫无意义的。

故此，在本申请的一种可选的实施例中，在将第一增量模型进行线上发布之后，可以按照预设周期在判断出第一增量模型中存在失效数据的情况下，从第一增量模型中清除失效数据，得到更新增量模型，并将更新增量模型进行线上发布。接下来，将结合图5对该实施方式进行具体说明。

图5是根据本申请实施例的另一种数据处理方法的流程图。如图5所示，该数据处理方法还包括以下步骤：

S501，按照预设周期判断第一增量模型中是否存在失效数据。

在本申请上述S501提供的技术方案中，在将第一增量模型进行线上发布之后，按照预设周期判断第一增量模型中是否存在失效数据，其中，失效数据为停止推送的第一待处理数据。

由于定期从模型中清除失效数据，可以定期从模型中清除失效数据的键值。因此，对于第一增量模型而言，在将第一增量模型进行线上发布之后，可以按照预设周期判断第一增量模型中是否存在上述失效数据。

S502，从第一增量模型中清除失效数据，得到更新增量模型。

在本申请上述S502提供的技术方案中，如果按照预设周期判断出第一增量模型中存在失效数据，则从第一增量模型中清除失效数据，得到更新增量模型。

在按照预设周期判断第一增量模型中是否存在失效数据之后，如果按照预设周期判断第一增量模型存在失效数据，也即，第一增量模型中的数据随着时间的推移，下架停止投放，则从第一增量模型中清除下架停止投放的数据，得到不存在失效数据的更新增量模型，从而使模型保持合理的大小，避免模型的尺寸不断膨胀，且投放毫无意义的数据。

S503，将更新增量模型进行线上发布。

在从第一增量模型中清除失效数据，得到不存在失效数据的更新增量模型之后，将该更新增量模型进行上线推送，预估数据的点击率。

该实施例在将第一增量模型进行线上发布之后，按照预设周期判断第一增量模型中是否存在失效数据，其中，失效数据可以为停止推送的第一待处理数据。如果按照预设周期判断出第一增量模型中存在失效数据，则从第一增量模型中清除失效数据，得到不存在失效数据的更新增量模型，接着，将该更新增量模型进行线上发布，从而使模型保持合理的大小，避免模型的尺寸不断膨胀，且投放毫无意义的数据，进而实现了快速更新数据处理的模型的技术效果。

作为一种可选的实施例，S502中的“从第一增量模型中清除失效数据，得到更新增量模型”的步骤，可以包括：获取第一增量模型中不在通过将第二时间窗口扩大预设倍数得到的第四时间窗口内的第二待处理数据，将第一增量模型中不在第四时间窗口内的第二待处理数据作为失效数据；从第一增量模型中清除失效数据，得到更新增量模型。

接下来，结合图6来说明本申请实施例中如何从第一增量模型中清除失效数据，得到更新增量模型。

图6是根据本申请实施例的一种从第一增量模型中清除失效数据的方法的流程图。如图6所示，该从第一增量模型中清除失效数据，得到更新增量模型的方法包括以下步骤：

S601，将第二时间窗口扩大预设倍数，得到第四时间窗口。

在将第一增量模型进行线上发布之后，如果按照预设周期判断出第一增量模型中存在失效数据，则将第二时间窗口按照时间拉长的预设倍数进行扩大，得到第四时间窗口。并以第四时间窗口为屏障，也就是说，以第四时间窗口的边界作为判断数据是否为失效数据的界限，若数据处于第四时间窗口内，则可以认为该数据并非失效数据，若数据并不处于第四时间窗口内，则可以认为该数据为失效数据。

S602，获取第一增量模型中的第二待处理数据，将该第二待处理数据作为所述失效数据，其中，第二待处理数据不在第四时间窗口内。

在将第二时间窗口扩大预设倍数，得到第四时间窗口之后，由于不处于第四时间窗口内的数据，可以认为该数据为失效数据。因此，可以获取第一增量模型中不在第四时间窗口内的第二待处理数据，并将该第二待处理数据作为第一增量模型中的失效数据。也就是说，可以获取第一增量模型中不在该第四时间窗口内的特征，并可以将该特征作为第一增量模型中的失效数据，其中，该第一增量模型中不在第四时间窗口内的特征可以为神经网络的神经元代表。

S603，从第一增量模型中清除失效数据，得到更新增量模型。

在获取第一增量模型中不在第四时间窗口内的第二待处理数据之后，可以将该第二待处理数据作为第一增量模型中的失效数据。接着，从第一增量模型中清除该第二待处理数据(即失效数据)，得到更新增量模型，也即，清除第一增量模型中不在第四时间窗口内的特征，得到更新增量模型。

上述清除失效数据的方法同样适用于从第二增量模型中清除失效数据的方法，以及在后续模型训练的过程中，对后续产生的新模型中的失效数据进行清除的方法，此处不再赘述。

该实施例通过将第二时间窗口扩大预设倍数，得到第四时间窗口；获取第一增量模型中不在第四时间窗口内的第二待处理数据，其中，将第一增量模型中不在第四时间窗口内的第二待处理数据作为失效数据；从第一增量模型中清除失效数据，得到更新增量模型，实现了从第一增量模型中清除失效数据，得到更新增量模型的目的，从而使模型保持合理的大小，进而达到了快速更新数据处理的模型的技术效果。

作为一种可选的实施例，在推送更新增量模型上线之后，可以根据第二时间和第四时间窗口确定第五时间窗口，并根据第五时间窗口内的第四待处理数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型，并将第三增量模型进行线上发布。接下来，将结合图7对该实施方式进行具体说明。

图7是根据本申请实施例的另一种数据处理方法的流程图。如图7所示，该数据处理方法还包括以下步骤：

S701，根据第二时间和第四时间窗口确定第五时间窗口。

在本申请上述S701提供的技术方案中，在推送更新增量模型上线之后，可以根据第二时间和第四时间窗口确定第五时间窗口，其中，第五时间窗口与第四时间窗口具有第三预设重叠区域。

在推送更新增量模型上线之后，可以对更新增量模型进行增量更新训练。首先，根据第二时间和第四时间窗口确定第五时间窗口，该第五时间窗口和第四时间窗口具有第三预设重叠区域。具体而言，可以将第二时间确定为第五时间窗口的右边界，即第五时间窗口的右边界可以契合第二时间。具体地，可以通过滑动第四时间窗口至第二时间，使滑动后的第四时间窗口的右边界契合第二时间，从而得到第五时间窗口的右边界。接着，将第五时间窗口的右边界向前推移第五时间窗口的长度，便可以得到该第五时间窗口的左边界，从而可以根据第五时间窗口的右边界和第五时间窗口的左边界确定出第五时间窗口。需要强调的是，第二时间可以为任意时间，当然，也可以理解为第三增量更新训练时所对应的当前时间。

S702，获取在第四时间窗口对应的时间之后产生的第三新增数据，并将第三新增数据和第二待处理数据合并为第四待处理数据。

在本申请上述S702提供的技术方案中，随着时间的推移，在第四时间窗口对应的时间之后产生第三新增数据，获取第三新增数据，并将第三新增数据和第一待处理数据合并为第四待处理数据，可以将该第四待处理数据作为接下来处理的数据对象。

S703，通过第四待处理数据中位于第五时间窗口内的第四目标数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型。

在本申请上述S703提供的技术方案中，根据第五时间窗口内的第四目标数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型。

在根据第二时间和第四时间窗口确定第五时间窗口之后，确定第四待处理数据中位于第五时间窗口内的第四目标数据，通过第四目标数据对更新增量模型进行第四预设次数的迭代训练。其中，该第四目标数据可以为广告点击曝光数据，即可以通过广告点击曝光数据对更新增量模型进行第四预设次数的迭代。在一种实施方式中，该第四预设次数可以小于或等于第一预设次数。这样，可以大大加快了线上模型的更新速度，能更快地反应用户的行为变化和新广告上线的影响。

S704，将第三增量模型进行线上发布。

在通过第四待处理数据中位于第五时间窗口内的第四目标数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型之后，对第三增量模型进行推送上线，用于预估对数据的点击率，可以预估对广告的点击率。

由于第三增量模型中存在停止推送的第一待处理数据，也即，第三增量模型中存在失效数据，并且，随着时间的推移，模型将不断累积新增数据，使得模型尺寸不断膨胀，因此，为了维持模型合理的大小，需要对第三增量模型中的失效数据也进行清除。在一种实施方式中，从第一增量模型中清除失效数据的方法的同样适用于从第三增量模型中清除失效数据的方法，即对模型中的无效数据进行清除的方法同样可以采取上述从第一增量模型中清除失效数据的方法，此处不再赘述。

该实施例通过在推送更新增量模型上线之后，根据第二时间和第四时间窗口确定第五时间窗口，其中，第五时间窗口与第四时间窗口具有第三预设重叠区域；通过第四待处理数据中位于第五时间窗口内的第四目标数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型；将第三增量模型进行线上发布，达到了快速更新数据处理的模型的技术效果。

作为一种可选的实施例，在通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，可以通过第一增量模型对历史数据进行拟合，得到拟合结果，通过第一增量模型携带拟合结果。接下来，将结合图8对该实施方式进行具体说明。

图8是根据本申请实施例的另一种数据处理方法的流程图。如图8所示，该数据处理方法还包括以下步骤：

S801，通过第一增量模型对历史数据进行拟合，得到拟合结果。

在本申请上述S801提供的技术方案中，在通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，通过第一增量模型对历史数据进行拟合，得到拟合结果，其中，该历史数据可以为处理过的待处理数据。

在通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，获取所有第一增量模型中的历史数据，接着，通过第一增量模型对历史数据进行拟合，得到拟合结果，从而可以获取对历史数据的拟合状态。例如，当该历史数据是历史广告数据时，可以通过学习拟合广告历史曝光数据，使得拟合结果具有在未来一段时间内预测广告点击率的作用。

S802，通过第一增量模型携带拟合结果。

通过第一增量模型对历史数据进行拟合，得到拟合结果之后，通过第一增量模型携带拟合结果。通过模型增量式训练使得模型中永远携带有对所有历史数据的拟合状态，相较于基于一定数据全量训练的模型，该通过模型增量式训练的模型对于用户行为和数据信息的认知更加泛化，因此该通过模型增量式训练的模型对于数据的点击率拟合预估更加准确。

该实施例通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，通过第一增量模型对历史数据进行拟合，得到拟合结果，其中，历史数据为处理过的待处理数据；通过第一增量模型携带拟合结果，实现了模型增量式训练使得模型中永远携带有对所有历史数据的拟合状态，达到了提高拟合预估准确性的效果。

作为一种可选的实施例，S202中的“通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练”的步骤可以包括：在冷启动状态下，对神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，冷启动状态为对神经网络进行首次处理时的状态；接着，通过第一待处理数据中位于第一时间窗口内的第一目标数据和初始化参数对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型。接下来，将结合图9对该实施方式进行具体说明。

图9是根据本申请实施例的一种通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练的方法的流程图。如图9所示，该方法包括以下步骤：

S901，在冷启动状态下，对神经网络的各层参数进行随机初始化处理，得到初始化参数。

其中，冷启动状态为对神经网络进行首次处理时的状态，为一种软件启动状态，比如，可以为在故障恢复之后的处理状态。

由于神经网络具有多层，因此，为了获取神经网络各层参数，需对各层参数进行随机初始化处理，比如可以采用平均分布随机初始化方法、高斯分布随机初始化方法、Xavier初始化方法等对神经网络的各层参数进行初始化处理，得到初始化参数。

S902，通过第一待处理数据中位于第一时间窗口内的第一目标数据和初始化参数对神经网络进行第一预设次数的迭代训练，从而得到神经网络的种子模型。

在图像分类领域，使用深度卷积神经网络训练图像分类模型时，在有标注的训练数据量较少时，往往在采用以ImageNet公开数据集训练基准1000分类模型A后，保留所有卷积层，重新初始化全连接层和设置分类目标，再使用自己的数据来训练出符合自己领域分类需求的模型。

一次全量的模型训练需要在随机初始化的模型基础上，使用充分的训练数据经过多轮迭代得到充分拟合数据的收敛模型，该收敛模型可以用于对数据进行处理。

该实施例通过在冷启动状态下，对神经网络的各层参数进行随机初始化处理，得到初始化参数；通过第一待处理数据中位于第一时间窗口内的第一目标数据和初始化参数对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，从而实现了通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练的目的，进而为达到了快速更新数据处理的模型的技术效果提供了基础。

作为一种可选的实施例，对神经网络的各层参数进行随机初始化处理可以包括但不限于以下方法之一：对该神经网络的各层参数分别进行按某常数初始化处理；对神经网络的各层参数进行平均分布随机初始化处理；对神经网络的各层参数进行高斯分布随机初始化处理；对神经网络的各层参数进行Xavier初始化处理。

作为一种可选的实施例，上述数据处理方法可以应用于预设场景下，该预设场景可以包括以下场景之一：媒体文件的CTR预估场景；图像识别模型的训练场景；语音识别模型的训练场景；自然语言理解模型的训练场景。

该实施例从两个方面考虑，一方面是否可以从旧模型中接力训练而避免从头学习；另一方面是否可以利用旧模型对历史数据的拟合能力，使得模型保持对所有知识的记忆，如果数据处理中的模型一直保持接力训练，则理论上任何历史数据都被模型学习过，而并非像基于特定数据集的冷启动全量训练一样，只对该特定数据集具有拟合能力。本申请实施例的功能特性为提升数据点击率预估的准确性，从而提升数据点击率和收入；性能特性为提升模型的训练效率，通过减少模型推送间隔和提高模型质量的方式，达到了快速反应用户和数据变化的目的。

需要说明的是，在该实施例的增量模型的更新方法中，在得到种子模型之后，后续在每一次模型的更新过程中，总是基于上次模型进行迭代训练得到新的增量模型，并将新的增量模型推送上线，如此不断进行下去，同时依据数据的特点定期从模型中删除失效数据以保持模型的规模和精度，上述增量模型包括但不限于上述第一增量模型、第二增量模型和第三增量模型。

实施例2

下面结合优选的实施例对本申请的技术方案进行说明，具体以深度神经网络模型的增量更新方法为例，以媒体文件的CTR预估场景进行说明。

当增量模型以成百上千的数量增加时，深度神经网络具备更强的表达能力，对数据非线性特征的拟合能力更强，对增量模型的多个权重的处理能力更强，从而可以更准确地预估CTR，进而可以提升预估广告点击率的能力。

该实施例的深度神经网络结构，是多层感知器MLP，它的基本特征是：网络中每个神经元模型包含一个可微的非线性激活函数；深度神经网络中包括一个或多个隐藏在输入和输出神经节点之间的层；深度神经网络展示出高度的连接性，其强度是由深度神经网络的突触权值决定的。可选地，训练MLP的常用的算法是反向传播算法(Back Propagation，简称为BP)。

当媒体文件为广告时，点击率预估为预估一个用户点击一个广告的概率，因此有pCTR＝f(user，ad)。其中，pCTR为用户点击一个广告的概率(Click-Through Rate Prediction)，user为用户特征，ad为广告特征。广告点击率预估是对广告曝光的效果的预测，是评价广告对用户吸引力的重要指标，直接影响在按点击计费模式下的广告投放收入。当广告曝光的数据量一定时，则有：收入＝CTR*CPC，其中，CPC(Cost Per Click)，表示每点击成本，为互联网广告领域的一种常见定价形式，为广告每次点击所产生的费用。

影响某一用户对于某一广告点击率的因素主要来源于用户特征和广告特征，不同用户即使对同一广告进行点击也存在巨大的区别；不同的广告的投放位置、展现形式影响用户的点击行为，不同的广告素材内容也能影响同一用户的点击行为。在基于特征的广告点击率预估实践中，逻辑回归模型是工业界长期使用来预测广告点击率模型的一种模型：

其中，x_i为用于描述用户特征和广告特征的向量；w_i为对应于x_i的每个特征的向量，表示x_i中每个特征的权重，由于它能够根据特征的取值来决定pCTR，w_i也被称为模型。

在数据处理中，模型训练的过程可以使用机器学习算法，通过拟合海量广告的曝光历史数据来学习，以确定w_i向量的合理取值。由于逻辑规模模型的代价函数是凸函数，因此训练逻辑归回模型快速、简单，在线预测效果好。

该实施例可以应用于广告点击率预估中，是一种广告点击率预估模型训练方法。功能特性为提升广告点击率预估的准确性，从而提升了广告点击率和广告收入；性能特性为提升模型训练效率，通过减少模型推送间隔和提高模型质量的方式，达到快速反应用户和广告行为变化的目的。

在互联网广告场景下，点击流数据的产生极为迅猛，每天产生大量的广告曝光数据。广告曝光数据由于包含了广告内容、用户内容，以及时间等上下文特征，是有价值的标注数据(以点击与否作为标注)。广告点击率预估模型可以通过学习拟合广告历史曝光数据，具有在未来一段时间内预测广告点击率的能力。一方面，广告点击率预估模型需要快速更新，这是因为用户行为和广告素材是时刻变化的；另一方面，要求广告点击率预估模型拟合海量历史数据以学习用户点击广告行为模式的不变特性。因此对于广告点击率预估模型的更新训练，若每次丢弃之前模型从头训练，将是十分浪费的。而根据迁移学习可知，根据模型学习到的知识是可以保留、迁移的，因此本技术方案采用增量更新方法训练广告点击率预估模型，下面对增量更新方法训练广告点击率预估模型进行介绍：

图10是根据本申请实施例的一种深度神经网络的全连接结构的示意图。如图10所示，该深度神经网络为2个隐藏层的MLP神经网络的神经元连接，比一般的神经网络更复杂。该深度神经网络的输入是将训练数据中每条广告曝光日志中用户特征和广告特征组合离散化后的独热编码(One-Hot Encoding)向量，输出为点击率预估。该深度神经网络包括了由于某输入向量中非零元使得深度神经网络训练中一次反向传播计算中需要参与的神经元，如图10中的斜划线神经元。该深度神经网络适用于广告CTR预估场景的深度学习模型(Deep Neural Networks，简称为DNN)。

图11是根据本申请实施例的另一种数据处理方法的流程图。如图11所示，该数据处理方法包括以下步骤：

步骤1：训练种子模型。

在冷启动状态下，通过初始化模型M，对模型M各层参数使用随机初始化方法；以当前时间倒溯，确定数据窗口T0，则数据窗口T0内数据时间跨度为[当前时间-T0，当前时间)；使用数据窗口T0内广告点击曝光数据训练模型I个迭代，训练得到种子模型M0，对种子模型暂不推送上线。

在一种实施方式中，该实施例中的训练种子模型所描述的步骤，对初始化模型的随机初始化方法可以为平均分布随机初始化方法、高斯分布随机初始化方法、Xavier初始化方法等。

步骤2：增量更新模型。

第1次增量更新训练：基于种子模型M0，滑动数据窗口T0，使数据窗口T0的右边界契合当前时间，得到滑动数据窗口T1；使用滑动数据窗口T1内广告点击曝光数据训练模型i个迭代，其中i<<I。

训练得到模型M1，推送模型M1上线，用于预估广告点击率，直至下次新模型推送。

第2次增量更新训练：

第2次增量更新训练：基于上一模型M1，滑动数据窗口T1，使数据窗口T1的右边界契合当前时间，得到滑动数据窗口T2；使用滑动数据窗口T2内广告点击曝光数据训练模型i个迭代，其中i<<I。

训练得到模型M2，推送模型M2上线，用于预估广告点击率，直至下次新模型推送。

以此类推，第n次增量更新训练：基于上一模型Mn-1，滑动数据窗口Tn-1，使数据窗口Tn-1的右边界契合当前时间，得到滑动数据窗口Tn；使用滑动数据窗口Tn内广告点击曝光数据训练模型i个迭代，其中i<<I。

训练得到模型Mn，推送模型Mn上线用于预估广告点击率，直至下次新模型推送。

模型在增量更新训练阶段，应适当减少模型学习步长，学习步长应小于或等于种子模型训练阶段最后1个迭代所用学习步长，以避免训练好的权重离开最优点。

需要说明的是，该实施例在增量更新训练模型所描述步骤，所用学习迭代数为可调配的，不应以不同的学习迭代数作为新的创意。

步骤3：定期清除失效键。

由于在训练种子模型之后，每次以增量更新步骤训练新模型，随时间的推移模型将不断累积使得模型尺寸不断膨胀。而互联网广告场景的特点是，每条广告具有一定的生命期t，超过预定投放时间后，广告将下架停止投放，于是此后再去预估这一类停止投放的广告将是毫无意义的。

设立定期从模型中清除失效键的步骤，从而维持模型保持合理的大小，保持学习投放中的广告。

图12是根据本申请实施例的一种定期清除失效键的示意图。如图12所示，对于某次增量更新模型Mn，以数据窗口Tn按时间拉长x倍得到Tn’为屏障，清除模型Mn不在此数据窗口内的特征(神经元代表)，也即，清除无效key所代表的输入层神经元及连接关系，得到模型Mn’，在下次(第n+1次)增量更新训练中，以Mn’代替Mn作为基准模型。

本技术方案的适用领域除了在广告CTR预估场景外，对于图像识别模型训练、语音识别模型训练、自然语言理解模型训练等场景，也是适用的、可移植的。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

实施例3

根据本申请实施例，还提供了一种用于实施上述数据处理方法的数据处理装置。图13是根据本申请实施例的一种数据处理装置的示意图。如图13所示，该数据处理装置可以包括：第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40和第一发布单元50。

第一获取单元10，用于获取输入至神经网络的第一待处理数据，其中，神经网络为待更新的模型。

第一迭代单元20，用于通过第一待处理数据中的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，所述第一目标数据位于第一时间窗口内，种子模型为神经网络的初始化模型。

第二获取单元30，用于获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据。

第二迭代单元40，用于通过第二待处理数据中的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型，其中，第二目标数据位于第二时间窗口内，第二时间窗口与第一时间窗口具有第一预设重叠区域。在一种实施方式中，第二时间窗口的右边界契合当前时间，且第二预设次数小于或等于第一预设次数。

第一发布单元50，用于将第一增量模型进行线上发布。

图14是根据本申请实施例的另一种数据处理装置的示意图。如图14所示，该数据处理装置可以包括：第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40和第一发布单元50。该数据处理装置还包括：第一确定单元60、第三获取单元70、第三迭代单元80和第二发布单元90。

需要说明的是，该实施例的第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40和第一发布单元50与图13所示实施例的数据处理装置中的作用相同。此处不再赘述。

第一确定单元60，用于在将第一增量模型进行线上发布图推之后，根据第一时间和第二时间窗口确定第三时间窗口，其中，第三时间窗口与第二时间窗口具有第二预设重叠区域。在一种实施方式中，第三时间窗口的右边界契合第一时间。

第三获取单元70，用于获取在第二时间窗口对应的时间之后产生的第二新增数据，并将第二新增数据和第二待处理数据合并为第三待处理数据。

第三迭代单元80，用于通过第三待处理数据中的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型，其中，第三目标数据位于第三时间窗口内。在一种实施方式中，第三预设次数小于或等于第一预设次数。

第二发布单元90，用于将第二增量模型进行线上发布。

图15是根据本申请实施例的另一种数据处理装置的示意图。如图15所示，该数据处理装置可以包括：第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40、第一发布单元50、第一确定单元60、第三获取单元70、第三迭代单元80和第二发布单元90。其中，第一确定单元60包括：判断模块61和确定模块62。

需要说明的是，该实施例中的第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40、第一发布单元50、确定单元60、第三获取单元70、第三迭代单元80和第二发布单元90与图14所示实施例的数据处理装置中的作用相同，此处不再赘述。

判断模块61，用于判断是否有用于推送新模型的指示信息，其中，新模型包括第二增量模型。

确定模块62，用于在判断出有指示信息时，将第一时间确定为第三时间窗口的右边界，滑动第二时间窗口至第三时间窗口的右边界，将第三时间窗口的右边界向前推移第三时间窗口的长度，得到第三时间窗口的左边界，根据第三时间窗口的右边界和第三时间窗口的左边界确定第三时间窗口。

图16是根据本申请实施例的另一种数据处理装置的示意图。如图16所示，该数据处理装置可以包括：第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40和第一发布单元50。该数据处理装置还包括：判断单元100、清除单元110和第三发布单元120。

需要说明的是，该实施例的第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40和第一发布单元50与图13所示实施例的数据处理装置中的作用相同，此处不再赘述。

判断单元100，用于在将第一增量模型进行线上发布之后，按照预设周期判断第一增量模型中是否存在失效数据，其中，失效数据为停止推送的第一待处理数据。

清除单元110，用于在按照预设周期判断出第一增量模型中存在失效数据，从第一增量模型中清除失效数据，得到更新增量模型。

第三发布单元120，用于将更新增量模型进行线上发布。

图17是根据本申请实施例的另一种数据处理装置的示意图。如图17所示，该数据处理装置可以包括：第一获取单元10、第一迭代单元20、第二获取单元30、第二迭代单元40、第一发布单元50、判断单元100、清除单元110和第三发布单元120。其中，清除单元110包括：扩大模块111、获取模块112和清除模块113。

需要说明的是，该实施例的第一获取单元10、第一迭代单元20、第二迭代单元40、第一发布单元50、判断单元100、清除单元110和第三发布单元120与图16所示实施例的数据处理装置中的作用相同，此处不再赘述。

扩大模块111，用于将第二时间窗口扩大预设倍数，得到第四时间窗口。

获取模块112，用于获取第一增量模型中的第二待处理数据，将第二待处理数据作为所述失效数据，其中，第二待处理数据不在第四时间窗口内。

清除模块113，用于从第一增量模型中清除失效数据，得到更新增量模型。

在一种实施方式中，该数据处理装置还包括：第二确定单元、第四获取单元、第四迭代单元和第四发布单元。

其中，第一确定单元，用于在推送更新增量模型上线之后，根据第二时间和第四时间窗口确定第五时间窗口，其中，第五时间窗口与第四时间窗口具有第三预设重叠区域。

第四获取单元，用于获取在第四时间窗口对应的时间之后产生的第三新增数据，并将第三新增数据和第二待处理数据合并为第四待处理数据。

第四迭代单元，用于通过第四待处理数据中的第四目标数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型，其中，第四目标数据位于第五时间窗口内；在一种实施例中，第四预设次数小于等于第一预设次数，第五时间窗口的右边界契合第二时间。

第四发布单元，用于将第三增量模型进行线上发布。

在一种实施方式中，该数据处理装置还包括：拟合单元和携带单元。其中，拟合单元用于在通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，通过第一增量模型对历史数据进行拟合，得到拟合结果，其中，历史数据为处理过的待处理数据。

携带单元，用于通过第一增量模型携带拟合结果。

在一种实施方式中，该数据处理装置还包括：第一迭代单元20包括：处理模块和迭代模块。其中，处理模块，用于在冷启动状态下，对神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，冷启动状态为对神经网络进行首次处理时的状态。

迭代模块，用于通过第一待处理数据中位于第一时间窗口内的第一目标数据和初始化参数对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型。

在一种实施方式中，上述处理模块用于对神经网络的各层参数进行随机初始化处理包括但不限于以下方法之一：对该神经网络的各层参数分别进行按某常数初始化处理；对神经网络的各层参数进行平均分布随机初始化处理；对神经网络的各层参数进行高斯分布随机初始化处理；对神经网络的各层参数进行Xavier初始化处理。

在一种实施方式中，上述预设场景可以包括以下之一：媒体文件的CTR预估场景；图像识别模型的训练场景；语音识别模型的训练场景；自然语言理解模型的训练场景

需要说明的是，该实施例中的第一获取单元10可以用于执行本申请实施例1中的S201，该实施例中的第一迭代单元20可以用于执行本申请实施例1中的S202，通过该实施例中的第二获取单元30可以用于执行本申请实施例中的S203；该实施例中的第二迭代单元40可以用于执行本申请实施例1中的S204，该实施例中第一发布单元50可以用于执行本申请实施例1中的S205。

此处需要说明的是，上述单元和模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在如图1所示的硬件环境中，可以通过软件实现，也可以通过硬件实现，其中，硬件环境包括网络环境。

该实施例通过第一获取单元10获取输入至神经网络的第一待处理数据，其中，神经网络为待更新的模型；通过第一迭代单元20通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，种子模型为神经网络的初始化模型，通过第二获取单元30获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据；第二迭代单元40通过第一待处理数据中位于第二时间窗口内的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型，其中，第二时间窗口与第一时间窗口具有第一预设重叠区域，通过第一发布单元50将第一增量模型进行线上发布，从而解决了数据处理的模型不能快速更新的问题的技术问题，进而达到了快速更新数据处理的模型的技术效果。

实施例4

根据本申请实施例，还提供了一种用于实施上述数据处理方法的服务器或终端。

图18是根据本申请实施例的一种终端的结构框图。如图18所示，该终端可以包括：一个或多个(图中仅示出一个)处理器181、存储器183、以及传输装置185，如图18所示，该终端还可以包括输入输出设备187。

其中，存储器183可用于存储软件程序以及模块，如本申请实施例中的数据处理方法和装置对应的程序指令/模块，处理器181通过运行存储在存储器183内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的数据处理方法。存储器183可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器183可进一步包括相对于处理器181远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置185用于经由一个网络接收或者发送数据，还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置185包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置185为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

其中，具体地，存储器183用于存储应用程序。

处理器181可以通过传输装置185调用存储器183存储的应用程序，以执行下述步骤：

获取输入至神经网络的第一待处理数据，其中，神经网络为待更新的模型；

通过第一待处理数据中的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，第一目标数据位于第一时间窗口内，种子模型为神经网络的初始化模型；

获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据；

通过第二待处理数据中的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型，其中，第二目标数据位于第二时间窗口内，第二时间窗口与第一时间窗口具有第一预设重叠区域；

将第一增量模型进行线上发布。

处理器181还用于执行下述步骤：在将第一增量模型进行线上发布之后，根据第一时间和第二时间窗口确定第三时间窗口，其中，第三时间窗口与第二时间窗口具有第二预设重叠区域；获取在第二时间窗口对应的时间之后产生的第二新增数据，并将第二新增数据和第二待处理数据合并为第三待处理数据；通过第三待处理数据中的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型，其中，第三目标数据位于第三时间窗口内；将第二增量模型进行线上发布。

处理器181还用于执行下述步骤：判断是否有用于推送新模型的指示信息，其中，新模型包括第二增量模型；如果判断出有指示信息，将第一时间确定为第三时间窗口的右边界，滑动第二时间窗口至第三时间窗口的右边界，将第三时间窗口的右边界向前推移第三时间窗口的长度，得到第三时间窗口的左边界，根据第三时间窗口的右边界和第三时间窗口的左边界确定第三时间窗口。

处理器181还用于执行下述步骤：在将第一增量模型进行线上发布之后，按照预设周期判断第一增量模型中是否存在失效数据，其中，失效数据为停止推送的第一待处理数据；如果按照预设周期判断出第一增量模型中存在失效数据，则从第一增量模型中清除失效数据，得到更新增量模型；将更新增量模型进行线上发布。

处理器181还用于执行下述步骤：将第二时间窗口扩大预设倍数，得到第四时间窗口；获取第一增量模型中的第二待处理数据，将第二待处理数据作为失效数据，其中，第二待处理数据不在第四时间窗口内；从第一增量模型中清除失效数据，得到更新增量模型。

处理器181还用于执行下述步骤：在推送更新增量模型上线之后，根据第二时间和第四时间窗口确定第五时间窗口，其中，第五时间窗口与第四时间窗口具有第三预设重叠区域；获取在第四时间窗口对应的时间之后产生的第三新增数据，并将第三新增数据和第二待处理数据合并为第四待处理数据；通过第四待处理数据中的第四目标数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型，其中，第四目标数据位于第五时间窗口内；将第三增量模型进行线上发布。

处理器181还用于执行下述步骤：在通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，通过第一增量模型对历史数据进行拟合，得到拟合结果，其中，历史数据为处理过的待处理数据；通过第一增量模型携带拟合结果。

处理器181还用于执行下述步骤：在冷启动状态下，对神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，冷启动状态为对神经网络进行首次处理时的状态；通过第一目标数据和初始化参数对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型。

采用本申请实施例，提供了一种数据处理的方案。通过获取输入至神经网络的第一待处理数据，其中，神经网络为待更新的模型；通过第一待处理数据中位于第一时间窗口内的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，种子模型为神经网络的初始化模型；获取在第一时间窗口对应的时间之后产生的第一新增数据，并将第一新增数据和第一待处理数据合并为第二待处理数据；通过第二待处理数据中位于第二时间窗口内的第二目标数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型，其中，第二时间窗口与第一时间窗口具有第一预设重叠区域；将第一增量模型进行线上发布的方式，达到了对增量模型进行更新、发布的目的，从而实现了快速更新数据处理的模型的技术效果，进而解决数据处理的模型不能快速更新的问题的技术问题。

在一种实施方式中，本实施例中的具体示例可以参考上述实施例中所描述的示例，本实施例在此不再赘述。

本领域普通技术人员可以理解，图18所示的结构仅为示意，终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图18其并不对上述电子装置的结构造成限定。例如，终端还可包括比图18中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图18所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

实施例5

本申请的实施例还提供了一种存储介质。在一种实施方式中，在本实施例中，上述存储介质可以用于执行数据处理方法的程序代码。

在一种实施方式中，上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。

在一种实施方式中，存储介质被设置为存储用于执行以下步骤的程序代码：

获取输入至神经网络的第一待处理数据，其中，第一目标数据位于第一时间窗口内，神经网络为待更新的模型；

通过第一待处理数据中的第一目标数据对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型，其中，种子模型为神经网络的初始化模型；

将第一增量模型进行线上发布。

在一种实施方式中，存储介质还被设置为存储用于执行以下步骤的程序代码：在将第一增量模型进行线上发布之后，根据第一时间和第二时间窗口确定第三时间窗口，其中，第三时间窗口与第二时间窗口具有第二预设重叠区域；获取在第二时间窗口对应的时间之后产生的第二新增数据，并将第二新增数据和第二待处理数据合并为第三待处理数据；通过第三待处理数据中的第三目标数据对第一增量模型进行第三预设次数的迭代训练，得到神经网络的第二增量模型，其中，第三目标数据位于第三时间窗口内；将第二增量模型进行线上发布。

在一种实施方式中，存储介质还被设置为存储用于执行以下步骤的程序代码：判断是否有用于推送新模型的指示信息，其中，新模型包括第二增量模型；如果判断出有指示信息，则将第一时间确定为第三时间窗口的右边界，滑动第二时间窗口至第三时间窗口的右边界，将第三时间窗口的右边界向前推移第三时间窗口的长度，得到第三时间窗口的左边界，根据第三时间窗口的右边界和第三时间窗口的左边界确定第三时间窗口。

在一种实施方式中，存储介质还被设置为存储用于执行以下步骤的程序代码：在将第一增量模型进行线上发布之后，按照预设周期判断第一增量模型中是否存在失效数据，其中，失效数据为停止推送的第一待处理数据；如果按照预设周期判断出第一增量模型中存在失效数据，则从第一增量模型中清除失效数据，得到更新增量模型；将更新增量模型进行线上发布。

在一种实施方式中，存储介质还被设置为存储用于执行以下步骤的程序代码：将第二时间窗口扩大预设倍数，得到第四时间窗口；获取第一增量模型中的第二待处理数据，将第二待处理数据作为失效数据，其中，第二待处理数据不在第四时间窗口内；从第一增量模型中清除失效数据，得到更新增量模型。

在一种实施方式中，存储介质还被设置为存储用于执行以下步骤的程序代码：在推送更新增量模型上线之后，根据第二时间和第四时间窗口确定第五时间窗口，其中，第五时间窗口与第四时间窗口具有第三预设重叠区域；获取在第四时间窗口对应的时间之后产生的第三新增数据，并将第三新增数据和第二待处理数据合并为第四待处理数据；通过第四待处理数据中的第四目标数据对更新增量模型进行第四预设次数的迭代训练，得到神经网络的第三增量模型，其中，所述第四目标数据位于所述第五时间窗口内；将第三增量模型进行线上发布。

在一种实施方式中，存储介质还被设置为存储用于执行以下步骤的程序代码：在通过第二时间窗口内的第一待处理数据对种子模型进行第二预设次数的迭代训练，得到神经网络的第一增量模型之后，通过第一增量模型对历史数据进行拟合，得到拟合结果，其中，历史数据为处理过的待处理数据；通过第一增量模型携带拟合结果。

在一种实施方式中，存储介质还被设置为存储用于执行以下步骤的程序代码：在冷启动状态下，对神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，冷启动状态为对神经网络进行首次处理时的状态；通过第一目标数据和初始化参数对神经网络进行第一预设次数的迭代训练，得到神经网络的种子模型。

在一种实施方式中，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

实施例6

本申请实施例还提供一种包括指令的计算机程序产品，当其在计算机上运行时，使得计算机执行前述各个实施例所述的数据处理方法中的任意一种实施方式。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

一种数据处理方法，包括：

获取输入至神经网络的第一待处理数据，其中，所述神经网络为待更新的模型；

通过所述第一待处理数据中的第一目标数据对所述神经网络进行第一预设次数的迭代训练，得到所述神经网络的种子模型，其中，所述第一目标数据位于第一时间窗口内，所述种子模型为所述神经网络的初始化模型；

获取在所述第一时间窗口对应的时间之后产生的第一新增数据，并将所述第一新增数据和所述第一待处理数据合并为第二待处理数据；

通过所述第二待处理数据中的第二目标数据对所述种子模型进行第二预设次数的迭代训练，得到所述神经网络的第一增量模型，其中，所述第二目标数据位于第二时间窗口内，所述第二时间窗口与所述第一时间窗口具有第一预设重叠区域；

将所述第一增量模型进行线上发布。
根据权利要求1所述的方法，所述第二时间窗口的右边界契合当前时间。
根据权利要求1所述的方法，在将所述第一增量模型进行线上发布之后，所述方法还包括：

根据第一时间和所述第二时间窗口确定第三时间窗口，其中，所述第三时间窗口与所述第二时间窗口具有第二预设重叠区域；

获取在所述第二时间窗口对应的时间之后产生的第二新增数据，并将所述第二新增数据和所述第二待处理数据合并为第三待处理数据；

通过所述第三待处理数据中的第三目标数据对所述第一增量模型进行第三预设次数的迭代训练，得到所述神经网络的第二增量模型，其中，所述第三目标数据位于所述第三时间窗口内；

将所述第二增量模型进行线上发布。
根据权利要求3所述的方法，所述第三时间窗口的右边界契合所述第一时间。
根据权利要求3所述的方法，所述根据第一时间和所述第二时间窗口确定第三时间窗口，包括：

判断是否有用于推送新模型的指示信息，其中，所述新模型包括所述第二增量模型；

如果判断出有所述指示信息，则将所述第一时间确定为所述第三时间窗口的右边界；

滑动所述第二时间窗口至所述第三时间窗口的右边界，并将所述第三时间窗口的右边界向前推移所述第三时间窗口的长度，得到所述第三时间窗口的左边界；

根据所述第三时间窗口的右边界和所述第三时间窗口的左边界确定所述第三时间窗口。
根据权利要求1所述的方法，在将所述第一增量模型进行线上发布之后，所述方法还包括：

按照预设周期判断所述第一增量模型中是否存在失效数据，其中，所述失效数据为停止推送的第一待处理数据；

如果按照所述预设周期判断出所述第一增量模型中存在所述失效数据，则从所述第一增量模型中清除所述失效数据，得到更新增量模型；

将所述更新增量模型进行线上发布。
根据权利要求6所述的方法，所述从所述第一增量模型中清除所述失效数据，得到所述更新增量模型，包括：

将所述第二时间窗口扩大预设倍数，得到第四时间窗口；

获取所述第一增量模型中的第二待处理数据，将所述第二待处理数据作为所述失效数据，其中，所述第二待处理数据不在所述第四时间窗口内；从所述第一增量模型中清除所述失效数据，得到所述更新增量模型。
根据权利要求7所述的方法，在推送所述更新增量模型上线之后，所述方法还包括：

根据第二时间和第四时间窗口确定第五时间窗口，其中，所述第五时间窗口与所述第四时间窗口具有第三预设重叠区域；

获取在所述第四时间窗口对应的时间之后产生的第三新增数据，并将所述第三新增数据和所述第二待处理数据合并为第四待处理数据；

通过所述第四待处理数据中的第四目标数据对所述更新增量模型进行第四预设次数的迭代训练，得到所述神经网络的第三增量模型，其中，所述第四目标数据位于所述第五时间窗口内；

将所述第三增量模型进行线上发布。
根据权利要求8所述的方法，所述第五时间窗口的右边界契合所述第二时间。
根据权利要求1所述的方法，在通过所述第二目标数据对所述种子模型进行第二预设次数的迭代训练，得到所述神经网络的第一增量模型之后，所述方法还包括：

通过所述第一增量模型对历史数据进行拟合，得到拟合结果，其中，所述历史数据为处理过的待处理数据；

通过所述第一增量模型携带所述拟合结果。
根据权利要求1所述的方法，所述通过所述第一待处理数据中的第一目标数据对所述神经网络进行第一预设次数的迭代训练，包括：

在冷启动状态下，对所述神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，所述冷启动状态为对所述神经网络进行首次处理时的状态；

通过所述第一目标数据和所述初始化参数，对所述神经网络进行所述第一预设次数的迭代训练，得到所述神经网络的种子模型。
根据权利要求11所述的方法，所述对所述神经网络的各层参数进行随机初始化处理，包括以下之一：

对所述神经网络的各层参数分别进行按某常数初始化处理；

对所述神经网络的各层参数进行平均分布随机初始化处理；

对所述神经网络的各层参数进行高斯分布随机初始化处理；

对所述神经网络的各层参数进行Xavier初始化处理。
根据权利要求1所述的方法，所述方法应用于预设场景下，所述预设场景包括以下之一：

媒体文件的CTR预估场景；

图像识别模型的训练场景；

语音识别模型的训练场景；

自然语言理解模型的训练场景。
根据权利要求1-13所述的方法，所述第二预设次数小于或等于所述第一预设次数。
根据权利要求3-5所述的方法，所述第三预设次数小于或等于所述第一预设次数。
根据权利要求8-9所述的方法，所述第四预设次数小于或等于所述第一预设次数。
一种数据处理设备，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行：获取输入至神经网络的第一待处理数据，其中，所述神经网络为待更新的模型；

通过所述第一待处理数据中的第一目标数据对所述神经网络进行第一预设次数的迭代训练，得到所述神经网络的种子模型，其中，所述第一目标数据位于第一时间窗口内，所述种子模型为所述神经网络的初始化模型；

获取在所述第一时间窗口对应的时间之后产生的第一新增数据，并将所述第一新增数据和所述第一待处理数据合并为第二待处理数据；

通过所述第二待处理数据中的第二目标数据对所述种子模型进行第二预设次数的迭代训练，得到所述神经网络的第一增量模型，其中，所述第二目标数据位于第二时间窗口内，所述第二时间窗口与所述第一时间窗口具有第一预设重叠区域；

将所述第一增量模型进行线上发布。
根据权利要求17所述的设备，所述第二时间窗口的右边界契合当前时间。
根据权利要求17所述的设备，所述处理器还用于根据所述程序代码中的指令执行：

在将所述第一增量模型进行线上发布之后，根据第一时间和所述第二时间窗口确定第三时间窗口，其中，所述第三时间窗口与所述第二时间窗口具有第二预设重叠区域；

获取在所述第二时间窗口对应的时间之后产生的第二新增数据，并将所述第二新增数据和所述第二待处理数据合并为第三待处理数据；

通过所述第三待处理数据中的第三目标数据对所述第一增量模型进行第三预设次数的迭代训练，得到所述神经网络的第二增量模型，其中，所述第三目标数据位于所述第三时间窗口内；

将所述第二增量模型进行线上发布。
根据权利要求19所述的设备，所述第三时间窗口的右边界契合所述第一时间。
根据权利要求19所述的设备，所述处理器还用于根据所述程序代码中的指令执行：

判断是否有用于推送新模型的指示信息，其中，所述新模型包括所述第二增量模型；

在判断出有所述指示信息时，将所述第一时间确定为所述第三时间窗口的右边界，滑动所述第二时间窗口至所述第三时间窗口的右边界，并将所述第三时间窗口的右边界向前推移所述第三时间窗口的长度，得到所述第三时间窗口的左边界，根据所述第三时间窗口的右边界和所述第三时间窗口的左边界确定所述第三时间窗口。
根据权利要求17所述的设备，所述处理器还用于根据所述程序代码中的指令执行：

在将所述第一增量模型进行线上发布之后，按照预设周期判断所述第一增量模型中是否存在失效数据，其中，所述失效数据为停止推送的第一待处理数据；

在按照所述预设周期判断出所述第一增量模型中存在所述失效数据，从所述第一增量模型中清除所述失效数据，得到更新增量模型；

将所述更新增量模型进行线上发布。
根据权利要求22所述的设备，所述处理器还用于根据所述程序代码中的指令执行：

将所述第二时间窗口扩大预设倍数，得到第四时间窗口；

获取所述第一增量模型中的第二待处理数据，将所述第二待处理数据作为所述失效数据，其中，所述第二待处理数据不在所述第四时间窗口内；

从所述第一增量模型中清除所述失效数据，得到所述更新增量模型。
根据权利要求23所述的设备，所述处理器还用于根据所述程序代码中的指令执行：

根据第二时间和第四时间窗口确定第五时间窗口，其中，所述第五时间窗口与所述第四时间窗口具有第三预设重叠区域；

获取在所述第四时间窗口对应的时间之后产生的第三新增数据，并将所述第三新增数据和所述第二待处理数据合并为第四待处理数据；

通过所述第四待处理数据中的第四目标数据对所述更新增量模型进行第四预设次数的迭代训练，得到所述神经网络的第三增量模型，其中，所述第四目标数据位于所述第五时间窗口内；

将所述第三增量模型进行线上发布。
根据权利要求24所述的设备，所述第五时间窗口的右边界契合所述第二时间。
根据权利要求17所述的设备，所述处理器还用于根据所述程序代码中的指令执行：

通过所述第一增量模型对历史数据进行拟合，得到拟合结果，其中，所述历史数据为处理过的待处理数据；

通过所述第一增量模型携带所述拟合结果。
根据权利要求17所述的设备，所述处理器还用于根据所述程序代码中的指令执行：

在冷启动状态下，对所述神经网络的各层参数进行随机初始化处理，得到初始化参数，其中，所述冷启动状态为对所述神经网络进行首次处理时的状态；

通过所述第一目标数据和所述初始化参数，对所述神经网络进行所述第一预设次数的迭代训练，得到所述神经网络的种子模型。
根据权利要求27所述的设备，所述处理器对所述神经网络的各层参数进行随机初始化处理，包括以下之一：

对所述神经网络的各层参数进行平均分布随机初始化处理；

对所述神经网络的各层参数进行高斯分布随机初始化处理；

对所述神经网络的各层参数进行Xavier初始化处理。
根据权利要求17所述的设备，所述设备应用于预设场景下，所述预设场景包括以下之一：

媒体文件的CTR预估场景；

图像识别模型的训练场景；

语音识别模型的训练场景；

自然语言理解模型的训练场景。
一种存储介质，其特征在于，所述存储介质用于存储程序代码，所述程序代码用于执行权利要求1-16任一项所述的数据处理方法。
一种数据处理方法，应用于数据处理设备，所述数据处理设备执行权利要求1-16任意一项所述的方法。