CN111126621B

CN111126621B - 在线模型训练方法及装置

Info

Publication number: CN111126621B
Application number: CN201911298893.1A
Authority: CN
Inventors: 卢军; 方磊; 杨睿辰
Original assignee: Beijing Zetyun Tech Co ltd
Current assignee: Beijing Zetyun Tech Co ltd
Priority date: 2019-12-17
Filing date: 2019-12-17
Publication date: 2021-02-09
Anticipated expiration: 2039-12-17
Also published as: CN111126621A

Abstract

本发明提供一种在线模型训练方法及装置。其中，在线模型训练方法包括：展示工作流配置界面，接收输入的工作流配置信息；根据所述工作流配置信息搭建工作流；基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数。本发明可通过工作流配置界面配置的信息建立用于在线模型训练的工作流，简化了操作流程，提高了工作效率；并基于工作流，利用实时流数据进行在线模型训练，可以提高模型的性能；同时，本发明基于参数服务器管理和更新模型参数，可以在海量实时流数据的使用场景中，有效利用数据和计算资源，提高了模型训练效率。

Description

在线模型训练方法及装置

技术领域

本发明涉及大数据处理技术领域，尤其涉及一种在线模型训练方法及装置。

背景技术

随着人工智能的发展，已经针对各种各样的业务场景进行建模和机器学习，因此各种各样的机器学习模型被运用在丰富的业务场景中。

传统的机器学习模型训练都是基于离线数据，训练得到的模型也是反映了离线数据的特点。在实时性要求较高的场合，线上数据变化很快，离线模型无法很好的适应于此种场合。

发明内容

为了解决上述技术问题，本发明提供一种在线模型训练方法及装置，以增强模型训练的实时性。

为了解决上述技术问题，本发明实施例提供了一种在线模型训练方法，包括：展示工作流配置界面，接收输入的工作流配置信息；根据所述工作流配置信息搭建工作流；基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数。

在一种可能的实现方式中，所述工作流包括数据接收算子和数据处理算子，所述基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数，包括：基于数据接收算子接收第一实时流数据；基于数据处理算子，并利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；根据模型参数更新量确定更新的模型参数。

在一种可能的实现方式中，工作流配置信息包括模型初始化信息，所述方法还包括：根据所述模型初始化信息初始化所述待训练模型。

在一种可能的实现方式中，所述模型参数存储于参数服务器，所述工作流配置信息还包括参数服务器地址信息，所述根据模型参数更新量确定更新的模型参数，包括：根据所述参数服务器地址信息将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

在一种可能的实现方式中，所述工作流还包括特征处理算子，所述方法还包括：基于特征处理算子对第一实时流数据进行数据预处理和/或特征处理。

在一种可能的实现方式中，所述工作流配置信息包括性能判定周期Tu，所述方法还包括：计算所述待训练模型在各个性能判定周期Tu的模型性能指标；在模型性能指标满足模型发布条件的情况下，发布完成训练的待训练模型。

在一种可能的实现方式中，发布完成训练的待训练模型，包括：利用完成训练的待训练模型替换运行于生产环境的原模型；或发布完成训练的待训练模型，以使完成训练的待训练模型和原模型共同运行于生产环境中。

在一种可能的实现方式中，所述工作流配置信息包括分流字段信息和分流指标信息；所述发布完成训练的待训练模型，以使完成训练的待训练模型和原模型共同运行于生产环境中之后，所述方法还包括：根据所述分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

在一种可能的实现方式中，所述在线模型训练方法通过数据实时处理系统执行，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量，包括：基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；基于所述多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；所述根据所述参数服务器地址信息将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数，包括：根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述工作流包括模型应用工作流，所述方法还包括：响应于模型应用指令，基于所述模型应用工作流，利用完成发布的完成训练的待训练模型处理数据。

本发明实施例还提供了一种在线模型训练方法，包括：接收第一实时流数据；利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数。

在一种可能的实现方式中，所述在线模型训练方法通过数据实时处理系统执行，所述模型参数存储于所述参数服务器，利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数，包括：利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

在一种可能的实现方式中，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量，包括：基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；基于多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；所述将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述方法还包括：计算所述待训练模型在各个性能判定周期Tu的模型性能指标；在模型性能指标满足模型发布条件的情况下，发布完成训练的待训练模型。

在一种可能的实现方式中，所述发布完成训练的待训练模型，以使完成训练的待训练模型和原模型共同运行于生产环境中之后，所述方法还包括：根据分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

本发明实施例还提供了一种在线模型训练装置，包括：展示模块，用于展示工作流配置界面，接收输入的工作流配置信息；搭建模块，用于根据所述工作流配置信息搭建工作流；第一训练模块，用于基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数。

在一种可能的实现方式中，所述工作流包括数据接收算子和数据处理算子，所述第一训练模块包括：接收单元，用于基于数据接收算子接收第一实时流数据；第一训练单元，用于基于数据处理算子，并利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；根据模型参数更新量确定更新的模型参数。

在一种可能的实现方式中，工作流配置信息包括模型初始化信息，所述装置还包括：初始化模块，用于根据所述模型初始化信息初始化所述待训练模型。

在一种可能的实现方式中，所述模型参数存储于参数服务器，所述工作流配置信息还包括参数服务器地址信息，所述第一训练单元包括：更新子单元，用于根据所述参数服务器地址信息将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

在一种可能的实现方式中，所述工作流还包括特征处理算子，所述装置还包括：特征处理模块，用于基于特征处理算子对第一实时流数据进行数据预处理和/或特征处理。

在一种可能的实现方式中，所述工作流配置信息包括性能判定周期Tu，所述装置还包括：第一计算模块，用于计算所述待训练模型在各个性能判定周期Tu的模型性能指标；第一发布模块，用于在模型性能指标满足模型发布条件的情况下，发布完成训练的待训练模型。

在一种可能的实现方式中，所述第一发布模块包括：第一发布单元，用于利用完成训练的待训练模型替换运行于生产环境的原模型；或第二发布单元，用于发布完成训练的待训练模型，以使完成训练的待训练模型和原模型共同运行于生产环境中。

在一种可能的实现方式中，所述工作流配置信息包括分流字段信息和分流指标信息；所述装置还包括：第一分流模块，用于根据所述分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；第一数据输入模块，用于将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

在一种可能的实现方式中，所述在线模型训练装置通过数据实时处理系统执行，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述第一训练单元包括：第一调度子单元，用于基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；第一训练子单元，用于基于所述多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；所述更新子单元包括：子更新量更新子单元，用于根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述子更新量更新子单元包括：第一更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述子更新量更新子单元包括：第二更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述子更新量更新子单元包括：第三更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述工作流包括模型应用工作流，所述装置还包括：模型应用模块，用于响应于模型应用指令，基于所述模型应用工作流，利用完成发布的完成训练的待训练模型处理数据。

本发明实施例还提供了一种在线模型训练装置，包括：接收模块，用于接收第一实时流数据；第二训练模块，用于利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数。

在一种可能的实现方式中，所述在线模型训练方法通过数据实时处理系统执行，所述模型参数存储于所述参数服务器，第二训练模块包括：第二训练单元，用于利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；第一更新单元，用于将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

在一种可能的实现方式中，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述第二训练单元包括：第二调度子单元，用于基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；第二训练子单元，用于基于多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；第一更新单元包括：第四更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述第四更新子单元包括：第五更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述第四更新子单元包括：第六更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述第四更新子单元包括：第七更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

在一种可能的实现方式中，所述装置还包括：第二计算模块，用于计算所述待训练模型在各个性能判定周期Tu的模型性能指标；第二发布模块，用于在模型性能指标满足模型发布条件的情况下，发布完成训练的待训练模型。

在一种可能的实现方式中，第二发布模块包括：第三发布单元，用于利用完成训练的待训练模型替换运行于生产环境的原模型；或第四发布单元，用于发布完成训练的待训练模型，以使完成训练的待训练模型和原模型共同运行于生产环境中。

在一种可能的实现方式中，所述装置还包括：第二分流模块，用于根据分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；第二数据输入模块，用于将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

本发明实施例还提供了一种在线模型训练系统，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上述的在线模型训练方法的步骤。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上述的在线模型训练方法的步骤。

本发明的上述技术方案的有益效果如下：用户可以通过工作流配置界面配置的信息建立用于在线模型训练的工作流，简化了操作流程，提高了工作效率；并基于工作流，利用实时流数据进行在线模型训练，可以提高模型的性能；同时，本发明基于参数服务器管理和更新模型参数，可以在海量实时流数据的使用场景中，有效利用数据和计算资源，提高了模型训练效率。

附图说明

图1为本发明实施例的在线模型训练方法的流程示意图；

图2为本发明实施例的数据实时处理系统和参数服务器的架构示意图；

图3为本发明实施例的在线模型训练方法中工作流的示意图；

图4为本发明实施例的用于展示AUC的监控窗口的显示界面的示意图；

图5为本发明实施例的在线模型训练方法中工作流的示意图；

图6为本发明实施例的在线模型训练方法中工作流显示界面的示意图；

图7为本发明实施例的在线模型训练方法的流程示意图；

图8为本发明实施例的在线模型训练装置的结构示意图；

图9为本发明实施例的在线模型训练装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例的附图，对本发明实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，图1为本发明实施例的在线模型训练方法的流程示意图，该方法包括：

步骤S110、展示工作流配置界面，接收输入的工作流配置信息；

步骤S120、根据所述工作流配置信息搭建工作流；

步骤S130、基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数。

本实现方式中，所述在线模型训练方法可以基于连续不断的实时流数据对待训练模型进行训练，以保证模型的数据处理性能相对于实时变化的实时流数据具备较好的数据处理性能。

在一种可能的实现方式中，所述在线模型训练方法可以通过数据实时处理系统执行，其中，数据实时处理系统可以是一种调用实时流式计算引擎(例如Flink、Storm、Spark)，构建工作流，及控制流式计算引擎模块运行工作流的实时流数据处理系统，基于该方法可以提高数据实时处理系统的使用便利性，加快数据处理的速度，从而可以保证数据处理的实时性。

其中，所述工作流配置界面可以是所述数据实时处理系统中用于人机交互的界面；例如，可以用于接收用户输入的工作流配置信息的界面。

在一种可能的实现方式中，工作流配置界面可以是图形化界面或者命令行界面。其中，图形化界面即基于浏览器或桌面应用的界面(Graphical User Interface，简称GUI)，在该界面中，数据实时处理系统可以展示多种类型的图形化的工作流配置组件，用户可以通过例如拖拽、点击等可视化操作的方式输入工作流配置信息；命令行界面即用于接收编程语言指令的界面(command-line interface，简称CLI)，用户可以通过在命令行界面中编写代码的方式输入工作流配置信息。

在另外的实现方式中，用户可以基于自身的使用习惯对工作流配置界面的界面方式进行切换，以提高工作效率和用户体验性。

本实现方式中，所述工作流配置信息可以包括在线模型训练方法中各个阶段的配置信息，例如可以包括用于搭建所述工作流的信息、用于配置实时流数据的数据源的信息(例如Hadoop分布式文件系统hdfs文件或分布式数据库hive表)、用于配置所述待训练模型的模型算法的信息。其中，数据实时处理系统可以根据工作流配置信息中的部分或全部信息搭建所述工作流。

本实现方式中，基于连续不断的实时流数据对待训练模型中的参数进行迭代更新，完成一次在线模型训练过程确定所述更新的模型参数，基于更新的模型参数更新模型，从而完成一次模型的迭代更新。

通过本发明，用户可以通过工作流配置界面配置的信息建立用于在线模型训练的工作流，简化了操作流程，提高了工作效率；并基于工作流，利用实时流数据进行在线模型训练，可以提高模型的性能。

本实现方式中，工作流可以由算子和连接线组成，其中，算子表示对数据的处理和传输，是完成各计算规则/计算模型的计算抽象及用于上下游关联算子的数据传输。例如，算子可以从指定的数据源(如消息队列，数据库，网络等)获取数据，可以将数据输出到指定的目的(消息队列，数据库，网络等)，可以在接收到前一个算子输出的数据进行处理以后传输到下一个算子。算子之间的连接线可以用于表示数据流向的逻辑关系。具体的，所述算子至少包括：数据接收算子、数据处理算子和数据输出算子；其中，所述数据接收算子，用于从数据源中获取数据；所述数据处理算子，可以用于对获取的数据进行计算，生成待输出数据；所述数据输出算子，用于将所述待输出数据按预设方式输出。

本实现方式对待训练模型的训练过程可以包括多个训练周期(每个训练周期对应一次在线模型训练过程)。对应的，实时处理系统中海量连续的实时流数据可以被划分为多批第一实时流数据，每一批实时流数据用于一个训练周期。所述模型参数更新量可以理解为各个训练周期之间模型参数之间的差距，本实现方式通过每一批第一实时流数据计算该模型参数更新量来对待训练模型的参数进行更新，以得到更新的模型参数。

其中，所述模型初始化信息可以包括模型类型、模型的特征形状、评价指标、模型参数等信息。其中，所述模型类型包括以下至少之一：回归模型、二分类模型、多分类模型和聚类模型；模型的特征形状指变量的维度和变量中的列数，如：变量中包括性别列、收入列、年龄列、职业列等；评价指标包括以下至少之一：轮廓系数、同质性、完整性、AUC(AreaUnder Curve，曲线下面积)、准确率、精确率、召回率、F1分数、对数损失、解释差异分值、均值误差、均方误差、均方根误差、均方根对数误差、R2值和绝对均值误差。

在一种可能的实现方式中，所述模型初始化信息包括模型算法设置信息，具体的可以将待训练模型设置为逻辑回归(Logistic Regression)算法，因子分解机FM(Factorization Machine)算法，场感知因子分解机FFM(Field Aware FactorizationMachine)算法，遵循正则领导FTRL(Follow the Regularized Leader)算法以及基于神经网络的因子分解机DeepFM算法等算法模型至少之一。

本实现方式中，根据所述模型初始化信息初始化所述待训练模型，可以在所述基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数的步骤之前执行。初始化所述待训练模型的过程可以理解为包括将待训练模型的模型参数赋值为预设的初始值的过程。在另外的实现方式中，所述模型初始化信息可以由用户基于经验值确定，也可以由系统默认设置，例如系统默认的模型初始化信息包括基于正态分布随机数初始化待训练模型的模型参数。

其中，所述参数服务器用于存储待训练模型的当前状态的模型参数，以及根据当前状态的模型参数和模型参数更新量确定更新的模型参数，并把更新的模型参数发送到数据实时处理系统中。这样的好处在于，可以在海量实时流数据的使用场景中有效利用数据和计算资源，提高了模型训练效率。

本实现方式中，参数服务器地址信息即所述参数服务器的地址标识，具体包括IP地址和端口号。数据实时处理系统可以根据该IP(Internet Protocol，网际互连协议)地址和端口号将模型参数更新量发送至所述参数服务器。

其中，所述特征处理算子可以是用于数据预处理和/或特征处理等操作的算子。其中，数据预处理包括空值列删除、缺失值填充、去重、排序、过滤、清洗、异常行删除、异常值设置为空、数值处理、日期处理等操作中的至少之一；特征处理包括特征衍生、特征选择、特征融合等操作中的至少之一。

在一种可能的实现方式中，在线模型训练方法可以由数据实时处理系统和参数服务器协同执行，并通过分布式数据处理方式进行在线模型训练，以提高模型训练效率。具体的，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量，包括：基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；基于所述多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；所述根据所述参数服务器地址信息将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数，包括：根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

图2为本发明实施例中数据实时处理系统和参数服务器的架构示意图。作为示例，如图2所示，所述数据实时处理系统包括集群管理器和多个物理机，每个物理机中包括多个训练节点，每个物理机对应一个训练任务管理器(训练任务管理器1，训练任务管理器2，…，训练任务管理器M)；其中，所述集群管理器为数据实时处理系统的入口，用于为各个训练节点分配数据流量，以使得数据实时处理系统中各个训练节点的运算资源均衡分配，具体的集群管理器与各训练任务管理器交互用于分配数据流量。所述参数服务器用于存储待训练模型更新的模型参数(W')，并把更新的模型参数发送到各个训练节点，以及接收各个训练节点传回的模型参数更新量(ΔW)，并基于模型参数更新量(ΔW)进行整体模型参数的更新。

本实现方式中，所述数据调度分配规则用于将第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点，数据调度分配规则可以根据具体的业务场景设定。例如数据调度分配规则可以根据当前活跃的训练节点的数量，和模型训练指定的训练节点的数目进行平均分配，也即用于训练的实时流数据会均匀的发送至集群中的各台物理机上运行的训练节点用于对模型进行训练。例如，第一实时流数据中数据实时处理系统中实时流数据的个数为300条，物理机数量为3台，每台物理机中活跃的训练节点的数量均为16，模型训练指定的训练节点的数目为30，那么数据实时处理系统会在每一台物理机上运行10个训练节点以达到资源均衡分配，此时各个训练节点所分配到的实时流子数据数量为300/30。

具体的，模型参数可以是模型训练过程中可以优化的参数，例如可以是待训练模型中的一组特征权重值[w₁，w₂，w₃，…，w_n]，即如果我们有n个特征，那么对应的每一个特征就有一个对应的权重值，我们用一个向量W来表示所有特征的权重值[w₁，w₂，w₃，…，w_n]。模型训练的目的包括得到这一组特征权重的值。

本实现方式中，训练过程中的每一个训练周期对应于一个第一实时流数据。具体的，在一个训练周期中，数据实时处理系统中的集群管理器会对接收到的第一实时流数据进行数据调度，以均衡分配至各个训练任务管理器对应的训练节点，各个训练节点接收到集群管理器分配到的实时流子数据时，可以向参数服务器发送拉取当前参数的请求，请求成功后参数服务器向各个训练节点返回当前模型参数即所有特征权重值，并基于实时流子数据对待训练模型进行训练，得到参数更新量；训练过程中，参数服务器会监听训练节点的数据发送信号，当接收到训练节点发送来的模型参数更新量后，可以按照预设的在线模型训练的模型算法更新模型参数中的所有特征权重值，例如可以用计算公式W'＝W+α*ΔW，计算特征权重值；其中，W'表示更新的模型参数，W表示更新前的特征权重值，ΔW表示模型参数更新量，α表示学习率。这里的W、W'、ΔW均是一维数组构成的向量。

对于每个训练周期，每个训练节点可以产生一个参数子更新量，参数服务器可以基于各个训练节点发送的参数更新量进行更新。

进一步的，在进行模型训练前，可以启动参数服务器，并基于参数服务器根据所述模型初始化信息初始化所述待训练模型。

本实现方式中，参数服务器可以通过同步更新、异步更新或延时异步更新等方式对模型参数进行更新。

具体的，在通过同步更新的方式进行模型更新的过程中，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。各个训练节点的数据运行效率可能不同，也即计算模型参数子更新量所需要的时间也可能会不同，因此为了保证数据运算资源的有效利用，在每一个训练周期中，参数服务器可以等待接收到全部训练节点反馈的模型参数子更新量的情况下，再开始模型参数的更新操作。

在另外的实现方式中，所述根据多个模型参数子更新量确定更新的模型参数，包括：基于加权平均的计算规则，并根据多个模型参数子更新量确定更新的模型参数。

具体的，在通过异步更新的方式进行模型更新的过程中，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。为了保证数据的实时性，本实现方式中，参数服务器可以在接收到任意一个模型参数子更新量的情况下，就开始模型参数的更新操作。

具体的，在通过延时异步更新的方式进行模型更新的过程中，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

本实现方式中，延时异步更新可以理解为介于同步更新和异步更新之间的折中方案。其中，所述参数更新预设时长可以由系统默认或用户设定，其用于表示在参数服务器接收到任意一个模型参数子更新量后，等待参数更新预设时长，然后参数服务器根据收到的模型参数子更新量进行更新。

作为示例，参数更新预设时长可以设定为Tm，即每一个训练节点的模型更新会等待其余的训练节点的模型参数子更新量不超过Tm，如果在预设时间间隔内(参数更新预设时长)，所有训练节点的模型参数子更新量(或称更新梯度)都到达参数服务器，那就相当于完成一次同步更新。如果超过参数更新预设时长还有训练节点的模型参数子更新量没有传回参数服务器，则只基于传回的部分进行更新。

在另外的实现方式中，所述方法还包括：利用预设的参数定期落盘存储机制定期存储更新的模型参数。具体的，为了避免参数服务器在运行过程中出现意外导致在线模型训练成果丢失的情况，本发明中还包括参数服务器模型的参数定期落盘存储机制。具体为，参数服务器运行过程中会定期将当前最新的模型参数保存下来，一旦出现程序运行故障的情况，重启参数服务器进程后，会自动从最新保存参数的位置读取故障前保存的模型参数，然后继续基于新数据进行模型训练更新。具体的，用户可自定义设置模型参数的保存频率，例如保存频率可以设置每分钟或每小时保存一次，系统默认每15分钟保存一次。

其中，所述模型性能指标用于评价待训练模型的各项性能，例如可以用于评价处理结果准确性、数据运行效率等性能。具体的，可以通过例如AUC指标、F1分数指标和ROC(Receiver Operating Characteristic，接收者运行特征曲线)指标等量化指标进行评价。其中，AUC指标用于表示正样本的score分数大于负样本的score的概率；F1分数指标为查准率与查全率的加权调和平均数。

所述模型发布条件用于判定完成训练的待训练模型是否可以发布至生产环境中，在模型性能指标满足模型发布条件的情况下，将待训练模型发布至生产环境，并基于发布的待训练模型处理生产数据。在模型性能指标不满足模型发布条件的情况下，则不发布该待训练模型。

其中，所述生产数据可以理解为在生产环境中流动的实时流数据，例如所述生产数据可以包括第二实时流数据。

图3为本发明实施例的在线模型训练方法中工作流的示意图，如图3所示，所述数据实时处理系统可以包括在线模型训练端和在线模型预测端，处于图3上侧的流程(在线模型预测工作流)由在线模型预测端执行，其包括特征处理和在线模型预测两个模块，处于图3下侧的流程(在线模型训练工作流)由在线模型训练端执行，其包括特征处理、在线模型训练和模型指标判断推送三个模块。其中，模型指标判断推送包括模型性能指标的判定过程，通过模型指标判定推送模块来决定是否将在线模型训练得到的模型推送至在线模型预测端进而发布完成训练的模型。在另外的实现方式中，

模型指标判定推送模块内部设计了定时的缓存单元，用来计算性能判定周期Tu内在在线模型训练端的模型的性能指标，并根据是否满足用户预设的模型发布条件来决定是否把新模型(即完成训练的模型)推送至预测端，不符合模型发布条件的新模型不发布，或可等待下一个性能判定周期Tu进行判定，即Tu为判定时间间隔。

作为示例，用户可以根据模型的复杂程度来定义性能判定周期Tu和模型发布条件，例如可以将性能判定周期设定为10分钟或30分钟；模型发布条件可以设定为AUC大于或等于0.7。

在另外的实现方式中，在线模型预测工作流和在线模型训练工作流之间的交互可以通过在模型指标判定推送模块中指定预测端的地址标识和模型标识实现。同时，为了便于模型训练人员掌握模型训练过程中的动态信息，模型指标判定推送模块还可以提供模型训练指标的监控窗口。在一种可能的实现方式中，所述方法还包括：通过监控窗口展示模型性能指标。作为示例，如图4所示，可以将用于表示模型学习成功率的AUC展示于模型训练指标的监控窗口，监控过程中，模型指标判定推送模块可以实时监测待训练模型的AUC指标(AUC是一个用来描述模型预测结果准确性的指标，通常值介于0-1之间)，指标监控窗口如下图所示，例如可以在指标监控窗口绘制一个或多个性能判定周期采集到的指标参数AUC，在该监控窗口中横轴表示时间，纵轴是AUC。

在另外的实现方式中，所述工作流包括模型应用工作流，所述方法还包括：响应于模型应用指令，基于所述模型应用工作流，利用完成发布的完成训练的待训练模型处理数据。其中，所述模型应用工作流用于利用完成发布的待训练模型处理数据。具体的所述模型应用工作流可以包括在线模型预测工作流。

其中，生产环境用于表示正式对用户提供服务的程序运行环境，即实际应用环境，该环境下具有连续且实时更新的海量实时流数据。所述原模型用于表示正在生产环境中运行的模型。

本实现方式中，可以通过多种方式发布完成训练的待训练模型，进而为不同的实际应用场景下提供不同的发布条件，例如可以利用完成训练的待训练模型替换运行于生产环境的原模型，具体的替换过程中，可以将更新的模型参数替换原模型中的模型参数，以达到模型替换的效果。又例如，可以利用完成训练的待训练模型和原模型同时运行在生产环境中。

在一种可能的实现方式中，为了解决生产环境中(例如产品实时推荐场景、实时预测场景、风控场景等)完成训练的待训练模型和生产数据不匹配导致预测效果不佳问题，本实现方式通过分流控制调节分配到完成训练的待训练模型(即附图中的模型B)的数据流量，然后根据模型预测反馈来进一步调整流量，直至完成训练的待训练模型对线上数据的预测表现达到预期，从而实现生产环境模型迭代升级的平稳过渡。对应的，所述工作流配置信息包括分流字段信息和分流指标信息；所述发布完成训练的待训练模型，以使完成训练的待训练模型和原模型共同运行于生产环境中之后，所述方法还包括：根据所述分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

为了区分在线模型训练端和在线模型预测端中使用的数据不同，本实现方式中将在线模型训练端中所使用的数据定义为第一实时流数据，将在线模型预测端所使用的数据定义为第二实时流数据，其中，第一实时流数据包括数据标签，第二实时流数据则不包括数据标签。在实际应用分流过程中使用第二实时流数据。

本实现方式中，所述分流指标信息可以包括系统默认的指标阈值，也可以是用户自定义的指标阈值，其可以包括数据分流用的判定规则，也可以包括数据调整过程中的单位数据量，和数据调整周期Ts。数据分流用的判定规则可以定义为完成训练的模型的指标值是否高于原模型的指标值，若是，则将输入至完成训练的模型的数据量增大。作为示例，动态分流过程中，可以每间隔时间Ts监控一次，当监控到完成训练的模型的指标值高于原模型的指标值时，对第一分流数据的数据量增大10％直至占有全部流量，反之则缩减10％直至分配到的流量为0。分流字段信息可以是实时流数据中的任意字段，基于该字段对实时流数据进行切分。

图5为本发明实施例的在线模型训练方法中工作流的示意图，如图5所示的，该工作流中包括预测效果监控模块，利用该预测效果监控模块可以通过采集预测效果监控的数据反馈，确定模型预测结果和实际预测对象的真实行为的匹配程度，并动态调整生产环境中实时数据流的分流程度。作为示例，在点击率预估的使用场景中，模型预测用户行为即用户点击模型推荐的产品的点击转化率，如果点击转化率等于或大于分流指标阈值R，则增加第一分流数据的数据量，反之，则缩减或者维持第一分流数据的数据量，从而实现了自动对流经的数据进行分流至不同的模型预测模块。

在一个训练周期过程中，完成训练的待训练模型(即在线模型预测B)和原模型(即在线模型预测A)接收到的数据量一直受到动态流量分配调整，该动态调整通过接收线上预测效果反馈指标(例如推荐产品的点击转化率)进行调整，在下一个完成训练的待训练模型的时间节点到来时，如果需要发布，上一个完成训练的待训练模型B得到保留，原模型A被即将发布的模型替换，再次形成新旧两个模型的格局，持续迭代。

作为一个优选的实施例，所述工作流可以包括至少两个子工作流，如图6所示，矩形框表示工作流中的算子，算子之间的连线表示工作流中的连接线。具体的，位于图6左侧的工作流为模型训练子工作流，(对应于位于图3下侧的工作流)，位于图6右侧的工作流为模型预测子工作流(对应于位于图3上侧的工作流、图5所示的工作流)。所述模型训练子工作流包括训练数据源、输入格式转换、特征处理、在线模型训练、模型指标判定更新、输出格式转换、训练结果输出等算子；所述模型预测子工作流包括预测数据源、输入格式转换、特征处理、分流、在线模型预测A、在线模型预测B、输出格式转换、预测结果输出等算子。用户通过工作流配置界面(例如前端UI界面)搭建模型训练工作流，配置训练数据的接入接出，选定模型算法，然后启动工作流。当有数据发送进来，就开始进行模型的训练。

以点击率预估场景(预测场景)为例，对模型训练子工作流进行阐述，具体的，在线模型训练端(执行模型训练子工作流)所使用的第一实时流数据可以是用户个人信息(例如年龄，性别等等)，当前环境信息(如位置，时间，天气等等)以及打过标签的信息(例如某条广告是否被点击)，第一实时流数据(即训练数据)经过数据接入端(例如Kafka等消息队列组件)，模型训练子工作流中需要对数据进行格式转换和特征处理(例如分桶，独热编码(One-Hot Encoding)等等)，经过一系列特征处理变成模型需要的数据类型后，在线模型训练算子会按照在线模型训练方法进行在线模型训练，来更新模型参数。具体的模型参数的更新方法可以包括：①初始化特征权重值；②采用随机梯度下降，通过损失函数求偏导计算ΔW，及基于公式W'＝W+α*ΔW计算W'。

然而，由于实时流数据永远不会停止，需要阶段性的按照指定的时间段即性能判定周期Tu进行模型发布，模型发布通过配置在线模型预测端的地址标识和模型标识(例如端口和模型名字)来指定需要把最新的模型参数发布到什么地方。另外由于实时训练数据(第一实时流数据)存在一定的偶然性，可能一个时间段内训练的模型效果并不好，通过进行模型性能指标判定(如AUC)来决定是否发布，如果当前模型指标达到或超过用户预设阈值，即将新模型发布到预测端，否则不发布新模型，直到下一个性能判定周期Tu的到来。

对于模型预测子工作流，所输入的第二实时流数据为生产环境中的实时流数据，其中的数据转换和特征处理过程可以与模型训练子工作流中数据转换和特征处理过程相同。在进行模型预测前，按照线上预测效果反馈分流送入新旧两代模型进行预测。在线模型预测端(执行模型预测子工作流)的新旧模型(在线模型预测A、在线模型预测B)分别对接收到的预测数据(第二实时流数据)进行预测，并将预测结果进行必要的转换(如数据格式转换)后输出到接出端(如消息队列Kafka)。

请参考图7，图7为本发明实施例的在线模型训练方法的流程示意图，该方法包括：

步骤S710、接收第一实时流数据；

步骤S720、利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数。

基于同一发明构思，请参考图8，本发明实施例还提供一种在线模型训练装置包括：

展示模块810，用于展示工作流配置界面，接收输入的工作流配置信息；

搭建模块820，用于根据所述工作流配置信息搭建工作流；

第一训练模块830，用于基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数。

基于同一发明构思，请参考图9，本发明实施例还提供一种在线模型训练装置包括：

接收模块910，用于接收第一实时流数据；

第二训练模块920，用于利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数。

本发明实施例还提供一种在线模型训练系统，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序；所述处理器执行所述程序时实现上述任一实施例中所述的在线模型训练方法的步骤。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一实施例中所述的在线模型训练方法中的步骤。

上述计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种在线模型训练方法，其特征在于，包括：

展示工作流配置界面，接收输入的工作流配置信息；

根据所述工作流配置信息搭建工作流；其中，所述工作流由算子和连接线组成；

基于所述工作流，利用实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数；

其中，所述工作流配置信息包括性能判定周期Tu，所述方法还包括：

计算所述待训练模型在各个性能判定周期Tu的模型性能指标；

在模型性能指标满足模型发布条件的情况下，发布完成训练的待训练模型；其中，所述完成训练的待训练模型和原模型共同运行于生产环境；

获取模型预测反馈；

根据所述模型预测反馈，动态调整分配到所述完成训练的待训练模型的实时流数据量；

其中，所述工作流配置信息包括分流字段信息和分流指标信息，所述根据所述模型预测反馈，动态调整分配到所述完成训练的待训练模型的实时流数据量包括：根据所述分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

2.根据权利要求1所述的方法，其特征在于，所述工作流包括数据接收算子和数据处理算子，所述基于所述工作流对待训练模型进行在线模型训练，以确定更新的模型参数，包括：

基于数据接收算子接收第一实时流数据；

基于数据处理算子，并利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；

根据模型参数更新量确定更新的模型参数。

3.根据权利要求1所述的方法，其特征在于，工作流配置信息包括模型初始化信息，所述方法还包括：

根据所述模型初始化信息初始化所述待训练模型。

4.根据权利要求2所述的方法，其特征在于，所述模型参数存储于参数服务器，所述工作流配置信息还包括参数服务器地址信息，所述根据模型参数更新量确定更新的模型参数，包括：

根据所述参数服务器地址信息将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

5.根据权利要求2所述的方法，其特征在于，所述工作流还包括特征处理算子，所述方法还包括：

基于特征处理算子对第一实时流数据进行数据预处理和/或特征处理。

6.根据权利要求4所述的方法，其特征在于，所述在线模型训练方法通过数据实时处理系统执行，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量，包括：

基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；

基于所述多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；

所述根据所述参数服务器地址信息将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数，包括：

根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

7.根据权利要求6所述的方法，其特征在于，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：

分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。

8.根据权利要求6所述的方法，其特征在于，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：

分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。

9.根据权利要求6所述的方法，其特征在于，所述根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：

分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

10.根据权利要求1所述的方法，其特征在于，所述工作流包括模型应用工作流，所述方法还包括：

响应于模型应用指令，基于所述模型应用工作流，利用完成发布的完成训练的待训练模型处理数据。

11.一种在线模型训练方法，其特征在于，包括：

接收第一实时流数据；

利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数；

获取模型预测反馈；

其中，所述根据所述模型预测反馈，动态调整分配到所述完成训练的待训练模型的实时流数据量包括：根据分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

12.根据权利要求11所述的方法，其特征在于，所述在线模型训练方法通过数据实时处理系统执行，所述模型参数存储于参数服务器，利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数，包括：

利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；

将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

13.根据权利要求12所述的方法，其特征在于，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量，包括：

基于多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；

所述将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数，包括：

分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

14.根据权利要求13所述的方法，其特征在于，所述分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：

15.根据权利要求13所述的方法，其特征在于，所述分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：

16.根据权利要求13所述的方法，其特征在于，所述分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数，包括：

17.一种在线模型训练装置，其特征在于，包括：

展示模块，用于展示工作流配置界面，接收输入的工作流配置信息；

搭建模块，用于根据所述工作流配置信息搭建工作流；其中，所述工作流由算子和连接线组成；

第一训练模块，用于基于所述工作流，利用实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数；

所述工作流配置信息包括性能判定周期Tu，所述装置还包括:

第一计算模块，用于计算所述待训练模型在各个性能判定周期Tu的模型性能指标；

第一发布模块，用于在模型性能指标满足模型发布条件的情况下，发布完成训练的待训练模型；

其中，所述完成训练的待训练模型和原模型共同运行于生产环境；

第一分流模块，用于获取模型预测反馈；以及，根据所述模型预测反馈，动态调整分配到所述完成训练的待训练模型的实时流数据量；

其中，所述工作流配置信息包括分流字段信息和分流指标信息；

所述第一分流模块，用于根据所述分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；

第一数据输入模块，用于将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

18.根据权利要求17所述的装置，其特征在于，所述工作流包括数据接收算子和数据处理算子，所述第一训练模块包括：

接收单元，用于基于数据接收算子接收第一实时流数据；

第一训练单元，用于基于数据处理算子，并利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；根据模型参数更新量确定更新的模型参数。

19.根据权利要求17所述的装置，其特征在于，工作流配置信息包括模型初始化信息，所述装置还包括：

初始化模块，用于根据所述模型初始化信息初始化所述待训练模型。

20.根据权利要求18所述的装置，其特征在于，所述模型参数存储于参数服务器，所述工作流配置信息还包括参数服务器地址信息，所述第一训练单元包括：

更新子单元，用于根据所述参数服务器地址信息将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

21.根据权利要求18所述的装置，其特征在于，所述工作流还包括特征处理算子，所述装置还包括：

特征处理模块，用于基于特征处理算子对第一实时流数据进行数据预处理和/或特征处理。

22.根据权利要求20所述的装置，其特征在于，所述在线模型训练装置通过数据实时处理系统执行，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述第一训练单元包括：

第一调度子单元，用于基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；

第一训练子单元，用于基于所述多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；

所述更新子单元包括：

子更新量更新子单元，用于根据所述参数服务器地址信息分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

23.根据权利要求22所述的装置，其特征在于，所述子更新量更新子单元包括：

第一更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。

24.根据权利要求22所述的装置，其特征在于，所述子更新量更新子单元包括：

第二更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。

25.根据权利要求22所述的装置，其特征在于，所述子更新量更新子单元包括：

第三更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

26.根据权利要求17所述的装置，其特征在于，所述工作流包括模型应用工作流，所述装置还包括：

模型应用模块，用于响应于模型应用指令，基于所述模型应用工作流，利用完成发布的完成训练的待训练模型处理数据。

27.一种在线模型训练装置，其特征在于，包括：

接收模块，用于接收第一实时流数据；

第二训练模块，用于利用所述第一实时流数据对待训练模型进行在线模型训练，以确定更新的模型参数；

第二计算模块，用于计算所述待训练模型在各个性能判定周期Tu的模型性能指标；

第二发布模块，用于在模型性能指标满足模型发布条件的情况下，发布完成训练的待训练模型；

第二分流模块，用于获取模型预测反馈；以及，根据所述模型预测反馈，动态调整分配到所述完成训练的待训练模型的实时流数据量；

其中，所述第二分流模型具体用于：根据分流字段信息和分流指标信息对第二实时流数据进行分流，得到分别对应于完成训练的待训练模型的第一分流数据和对应于原模型的第二分流数据；

第二数据输入模块，用于将第一分流数据输入至完成训练的待训练模型；将第二分流数据输入至原模型。

28.根据权利要求27所述的装置，其特征在于，所述在线模型训练方法通过数据实时处理系统执行，所述模型参数存储于参数服务器，第二训练模块包括：

第二训练单元，用于利用所述第一实时流数据对所述待训练模型进行在线模型训练，得到模型参数更新量；

第一更新单元，用于将模型参数更新量发送至参数服务器，以根据模型参数更新量确定更新的模型参数。

29.根据权利要求28所述的装置，其特征在于，所述数据实时处理系统包括多个训练节点；所述模型参数更新量包括多个模型参数子更新量，所述第二训练单元包括：

第二调度子单元，用于基于预设的数据调度分配规则，将所述第一实时流数据中包括的多个实时流子数据分别分配至各个训练节点；

第二训练子单元，用于基于多个实时流子数据，并利用所述多个训练节点对所述待训练模型进行训练，得到分别对应于各个实时流子数据的模型参数子更新量；

第一更新单元包括：

第四更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，以根据各个模型参数子更新量确定更新的模型参数。

30.根据权利要求29所述的装置，其特征在于，所述第四更新子单元包括：

第五更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到全部模型参数子更新量的情况下，根据多个模型参数子更新量确定更新的模型参数。

31.根据权利要求29所述的装置，其特征在于，所述第四更新子单元包括：

第六更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量的情况下，根据接收到的模型参数子更新量确定更新的模型参数。

32.根据权利要求29所述的装置，其特征在于，所述第四更新子单元包括：

第七更新子单元，用于分别发送所述各个模型参数子更新量至参数服务器，在参数服务器接收到任意一个模型参数子更新量后，在参数更新预设时长内，参数服务器继续接收模型参数子更新量，根据接收到的模型参数子更新量确定更新的模型参数。

33.一种在线模型训练系统，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述计算机程序被所述处理器执行时实现如权利要求1至16中任一项所述的在线模型训练方法的步骤。

34.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至16中任一项所述的在线模型训练方法的步骤。