WO2021208774A1

WO2021208774A1 - 辅助机器学习模型上线的方法及装置

Info

Publication number: WO2021208774A1
Application number: PCT/CN2021/085620
Authority: WO
Inventors: 周柯吉; 陈靓; 王太泽; 孔维
Original assignee: 第四范式（北京）技术有限公司
Priority date: 2020-04-17
Filing date: 2021-04-06
Publication date: 2021-10-21
Also published as: EP4138004A1; EP4138004A4; CN111523676B; CN111523676A; US20230043882A1

Abstract

公开了一种辅助机器学习模型上线的方法及装置。获取线下训练机器学习模型得到的模型文件；对所述模型文件进行解析，确定模型训练过程使用的训练数据表；在线上数据库中创建与所述训练数据表的表信息一致的线上数据表；将至少部分线下数据导入所述线上数据表。由此，在将离线训练的机器学习模型部署到线上时，利用本公开可以实现线上数据冷启动，为模型上线提供支持。

Description

辅助机器学习模型上线的方法及装置

本公开要求申请日为2020年4月17日、申请号为202010307148.5、发明名称为“辅助机器学习模型上线的方法及装置”的中国专利申请的优先权。

技术领域

本公开总体说来涉及人工智能领域，更具体地说，涉及一种辅助机器学习模型上线的方法及装置。

背景技术

机器学习是人工智能研究发展到一定阶段的必然产物，其致力于通过计算的手段，利用经验来改善系统自身的性能。在计算机系统中，“经验”通常以“数据”形式存在，通过机器学习算法，可从数据中产生“模型”，也就是说，将经验数据提供给机器学习算法，就能基于这些经验数据产生模型，在面对新的情况时，模型会提供相应的判断，即，预测结果。

目前机器学习应用场景大多是离线场景，比如营销名单产出、事后行为追踪等。在离线场景中，用户实际发生行为的时间要提前于当前模型预估决策的时间，使得这一时间间隔内发生的行为变化将无法被感知，模型预估效果会产生损失。

而随着业务迭代和决策节奏的加快，市场对于数据的时效价值越发关注，将机器学习模型上线以对线上数据进行实时预测，也就显得尤为重要。

发明内容

本公开的示例性实施例旨在提供一种机器学习模型上线的辅助方案，以为机器学习模型的上线提供支持。

根据本公开的第一个方面，提出了一种辅助机器学习模型上线的方法，包括：获取线下训练机器学习模型得到的模型文件；对模型文件进行解析，确定模型训练过程使用的训练数据表；在线上数据库中创建与训练数据表的表信息一致的线上数据表；将至少部分线下数据导入线上数据表。

根据本公开的第二个方面，还提出了一种辅助机器学习模型上线的装置，包括：获取模块，用于获取线下训练机器学习模型得到的模型文件；第一确定模块，用于对模型文件进行解析，确定模型训练过程使用的训练数据表；创建模块，用于在线上数据库中创建与训练数据表的表信息一致的线上数据表；导入模块，用于将至少部分线下数据导入线上数据表。

根据本公开的第三个方面，还提出了一种包括至少一个计算装置和至少一个存储指令的存储装置的系统，其中，所述指令在被所述至少一个计算装置运行时，促使所述至少一个计算装置执行如本公开第一个方面所述的方法。

根据本公开的第四个方面，还提出了一种存储指令的计算机可读存储介质，其中，当所述指令被至少一个计算装置运行时，促使所述至少一个计算装置执行如本公开第一个方面所述的方法。

根据本公开的第五个方面，还提出了一种计算装置，包括处理器和存储器，所述存储器中存储有计算机可执行指令集合，当所述计算机可执行指令集合被所述处理器执行时，使所述处理器执行如下步骤：获取线下训练机器学习模型得到的模型文件；对所述模型文件进行解析，确定模型训练过程使用的训练数据表；在线上数据库中创建与所述训练数据表的表信息一致的线上数据表；将至少部分线下数据导入所述线上数据表。

在根据本公开示例性实施例的辅助机器学习模型上线的方法及装置中，通过解析模型文件，创建与训练数据表的表信息一致的线上数据表，并将一定时间范围的离线训练数据导入创建的线上数据表，可以实现线上数据冷启动，为模型上线提供支持。

附图说明

从下面结合附图对本公开实施例的详细描述中，本公开的这些方面和优点、其他方面和优点中的至少一个将变得更加清楚并更容易理解，其中：

图1示出了根据本公开示例性实施例的辅助机器学习模型上线的方法的流程图；

图2示出了一种模型训练过程的DAG(有向无环图)；

图3示出了模型文件携带的部分信息示意图

图4示出了向用户展示的图形界面的示意图；

图5示出了向用户展示的服务详情页的示意图；

图6示出了一致性校验过程的示意图；

图7示出了模型上线流程示意性图；

图8示出了根据本公开示例性实施例的辅助机器学习模型上线的装置的结构框图。

具体实施方式

为了使本领域技术人员更好地理解本公开，下面结合附图和具体实施方式对本公开的示例性实施例作进一步详细说明。

图1示出了根据本公开示例性实施例的辅助机器学习模型上线的方法的流程图。图1所示的方法可完全通过计算机程序以软件方式实现，还可通过特定配置的计算装置来执行图1所示的方法。

参见图1，在步骤S110，获取线下训练机器学习模型得到的模型文件。

线下训练机器学习模型得到的模型文件，也即在离线环境中进行模型训练所得到的模型文件。机器学习模型的训练过程不是本公开的侧重点，不再赘述。模型文件中可以包括但不限于模型结构信息、训练过程配置信息等与模型训练相关的信息。

在步骤S120，对模型文件进行解析，确定模型训练过程使用的训练数据表。训练数据表是指模型训练过程中的特征处理步骤所对应的输入表，也即特征处理前的输入表。一般来说，在进行特征处理前会对原始的数据表执行预处理操作，以使得经过预处理后的数据表为符合训练需求的数据表。其中，训练数据表就是指经过预处理后的用于进行特征处理的输入表。

可以通过对模型文件进行解析，得到模型训练过程信息，并根据模型训练过程信息，将特征处理步骤对应的输入表作为模型训练过程使用的训练数据表。模型训练过程信息可以包括但不限于模型训练过程中的处理节点、处理节点对应的输入表、处理节点对应的输出表中的一项或多项。其中，处理节点可以视为模型训练过程中某个特定的机器学习步骤，处理节点处还可以包括对应的处理方法，处理方法可以是但不限于处理脚本或算子。

作为示例，模型文件中可以包括特征处理脚本(如特征构建脚本)。特征处理脚本可以是基于特定描述语言编写的。本公开可以通过对特征处理脚本进行解析，确定训练数据表。关于特征处理脚本的具体结构本公开不做限定。

图2示出了一种模型训练过程的DAG(有向无环图)。如图2所示，DAG包括数据表A、数据表B、数据预处理、特征处理、特征签名、模型训练。其中，数据表A并不直接进行特征处理，而是需要经过数据预处理，因此数据表A不满足训练数据表的定义。

作为示例，按照图2所示的DAG进行训练最终产出的模型文件可以携带图3所示的信息。本公开可以通过对模型文件进行解析，获取图3所示信息。其中图3所示的信息展示了算子节点(即上文述及的处理节点)之间的关系、算子节点的输入表、算子节点的输出表、特征处理脚本等内容。本公开可以根据上述内容从中筛选出特征处理前的输入表(即训练数据表)，例如可以将对数据表A进行预处理后得到的输入表以及数据表B作为训练数据表，并获取训练数据表的组织结构(schema)以及表名等表信息。在本实施例中，模型文件可以是基于编程语言的脚本文件，可以通过对脚本文件形式的模型文件进行筛选，得到图3所示的基于编程语言的信息，即图3所示的信息可以是取自模型文件的部分脚本。其中，图3中的“nodes”用于表征算子节点，“script”用于表示特征处理脚本，“inutTables”用于表示输入表，“outputTables”用于表示输出表。“uuid”、“cols”用于表示数据表结构及表名信息，如可以包括但不限于表名、表中字段名、字段类型等等。

在步骤S130，在线上数据库中创建与训练数据表的表信息一致的线上数据表。表信息可以是指训练数据表的组织结构(schema)以及表名等信息，如可以包括但不限于训练数据表中的字段名、字段类型等信息。在创建好线上数据表后，线上实时生成的数据(也即线上数据)就可以导入线上数据表。

线上数据库是指用于存储线上数据的数据库。线上数据库可以采用KV存储数据库(比如Redis或其他实时特征存储引擎RtiDB等)，以保证读写高性能、数据高可用等要求。并且在线上数据库中存储数据时需要结合特征构建的逻辑设置合理的key键值，比如特征构建的时候采用以name字段为key进行特征计算，那么创建线上数据表的时候需要设置name为存储key键值。

为此本公开还可以根据对模型文件进行解析时所确定的特征处理步骤涉及的字段名，在线上数据库中以字段名为键存储线上数据表中的数据，以确保线上数据读写高性能。即，对模型文件进行解析所确定的特征处理步骤还可以包括字段名和针对字段名的特征处理方法，本公开可以根据特征处理步骤涉及的字段名，在线上数据库中以字段名为键存储线上数据表中的数据。

在步骤S140，将至少部分线下数据导入线上数据表。

考虑到线上数据存在冷启动，即初始时刻线上数据表中可能没有足够用于进行模型预测的线上数据。在创建好线上数据表后，还可以将至少部分线下数据导入线上数据表，以解决数据冷启动问题。

考虑到线上数据库往往会采用内存存储的方式，若存储过多的数据会消耗机器资源以及线上性能。本公开还可以通过对模型文件进行解析，确定特征处理步骤针对的数据范围，并将对应于所确定的数据范围的线下数据导入线上数据表。例如，特征构建最大的时间区间是30天，那么只需要保证将数据范围为30天的线下数据导入线上数据表。由此在解决数据冷启动问题的同时，可以降低线上数据库的存储压力，降低资源成本。在一个实施例中，可以支持用户自定义导入数据，提供一定的灵活性以切合实际场景。

本公开通过解析模型文件，创建与训练数据表的表信息一致的线上数据表，并将一定时间范围的离线训练数据导入创建的线上数据表，可以实现线上数据冷启动，为模型上线提供支持。并且对于用户而言，只需要启动线上数据创建流程，选择期望上线的模型文件，后续可以由系统自动解析模型文件，创建相关线上数据表后自动将离线数据导入其中，从而可以减少用户手动创表、导表失败的情况发生。

在创建好线上数据表后，还可以部署用于实现机器学习模型的预测功能(也即线上预测功能)的预上线预测服务。并且在将预上线预测服务上线前，还可以对预上线预测服务的预测效果进行一致性校验，以确保预上线预测服务的可靠性。其中，一致性校验是指对预上线预测服务的线上预测结果与线下环境中的线下预测结果的一致性进行校验。

作为示例，可以利用预上线预测服务对待预测数据进行预测得到第一预测结果；在线下环境中对待预测数据进行预测得到第二预测结果；比较第一预测结果和第二预测结果；根据第一预测结果和第二预测结果之间的差异，确定是否上线预上线预测服务。若第一预测结果和第二预测结果之间的差异大于第一阈值，表明预上线预测服务的在线预测效果较差，可以对预上线预测服务进行修正，在修正后再次进行一致性校验；若第一预测结果和第二预测结果之间的差异小于第二阈值，表明预上线预测服务的线上预测效果与线下预测效果一致，可以将预上线预测服务部署到线上。其中，第一阈值大于等于第二阈值。待预测数据可以是用户指定的样例数据，也可以是线上数据库中的数据，还可以是其他来源的数据，对此本公开不做限定。

在线下环境中对待预测数据进行预测，也即利用线下训练得到的机器学习模型在线下环境中对待预测数据进行预测。作为示例，可以通过对模型文件进行解析，确定下游执行算子和模型预测算子，下游执行算子用于表征待预测数据在模型预测之前需要执行的操作；将待预测数据输入下游执行算子；将下游执行算子的输出输入模型预测算子，模型预测算子的输出即为对待预测数据进行预测得到的第二预测结果。

将机器学习模型应用于线上预测，可以处理实时请求数据，提高模型预估效果，但模型上线成本较高，在实际运用过程中需要较多定制化开发。本公开提出的辅助机器学习模型上线的方法，可以实现线上数据冷启动、模型上线评估校验，为机器学习模型的上线提供支持。

本公开的辅助机器学习模型上线的方法可以由用于实现机器学习相关业务的机器学习平台执行。机器学习平台可以通过可视化的方式为用户提供模型上线服务。例如，可以由机器学习平台向用户提供用于设置线上预测服务的图形界面，并接收用户通过图形界面选择的预上线预测服务。其中，机器学习平台可以向用户提供多个可供选择的预上线预测服务，每个预上线预测服务具有对应的模型文件，模型文件可以存储在后台服务端，可以根据用户选择的预上线预测服务，获取服务器端存储的与预上线预测服务对应的模型文件。另外用户也可以在选择预上线预测服务时，向机器学习平台上传模型文件。机器学习平台可以基于模型文件，通过执行上文结合图1所示的方法，实现线上数据冷启动、模型上线评估校验，为机器学习模型的上线提供支持。

图4示出了向用户展示的图形界面的示意图。

图4中示出的预上线应用即为上文述及的预上线预测服务。如图4所示，可以在图形界面中展示模型效果；也可以在图形界面中展示创建好的线上数据表(即图中示出的线上动态表)。其中，模型效果可以包括但不限于准确率、损失函数等模型评价指标。

可以向用户提供是否模拟上线的选项，用户可以根据需求选择是否模拟上线。若选择直接上线，也需要模块配置并进行环境校验，但不会做后续的一致性校验，如此将难以确保线上预测效果的可靠性，若出现不一致问题，反向定位成本高，因此建议用户选择模拟上线。此外用户在部署服务过程中，可以查看所含模型效果、对应线上数据表的存在情况，以辅助用户判断是否需要进行模拟上线应用部署(比如效果差、线上数据表异常，用户可以取消部署，避免资源浪费)。

还可以执行如下操作中的至少一个：在图形界面中展示向用户推荐的资源配置信息；接收用户通过图形界面设置的资源配置信息。例如，可以为用户提供“启用系统推荐”和“自定义资源参数”两个选择项，当用户选中“启用系统推荐”时，可以使用系统推荐的资源配置，当用户选中“自定义资源参数”时，可以接收用户输入的资源配置。

在设置完成后，可以启动环境校验，校验预上线预测服务的当前环境是否满足上线要求。此处述及的校验可以包括但不限于校验线上数据库是否可用、线上数据是否冷启动等。

若当前环境不满足上线要求，可以定位并修正问题。

若当前环境满足上线要求，可以完成预上线预测服务的部署，并向用户提供服务详情页。服务详情页可以用于展示预上线预测服务的以下至少一项服务信息：基本参数、模型参数、一致性校验结果、服务状态信息。其中，基本参数可以包括但不限于以下至少一项：服务名称、服务类型、运行状态、部署时间、运行时间、资源参数；模型参数可以包括但不限于以下至少一项：模型名称、模型类型、模型准确率、对数损失值；一致性校验结果可以包括但不限于一条或多条预测数据分别在线上环境中的预测结果和线下环境中的打分结果；服务状态信息可以包括但不限于以下至少一项：性能指标、日志信息和运行状态监控信息。

图5示出了向用户展示的服务详情页的示意图。

如图5所示，服务详情页面中可以呈现当前服务的基本参数、模块参数(包括所含模型、线上数据库)、一致性校验、服务状态(包括性能指标、日志和资源)等。其中，一致性校验是指进一步校验预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致；在预上线预测服务的预测性能与线下环境中机器学习模型的预测性能一致或基本一致的情况下，可以将预上线预测服务转为线上预测服务。

校验预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致的实现过程可以参见上文相关描述。作为示例，可以将模型自带样例数据作为待预测数据，也可以获取用户上传的样例数据，将用户指定的样例数据作为待预测数据。其中，用户还可以指定输出字段。然后可以启动用于模拟线下运行环境的离线预估任务和用于模拟线上运行环境的模拟预估任务，分别对样例数据进行预测。最后可以比较离线预估任务和模拟预估任务针对输出字段的输出结果是否一致。

图6示出了一致性校验过程的示意图。

如图6所示，可以在页面中呈现针对输出字段的离线预估结果和模拟预估结果。其中，离线预估服务和模拟预估服务的结果均会通过表格的方式呈现，用户可以点击“结果一致性校验”按钮对比两者结果，并呈现不一致的结果，也可以通过人工逐条对比，若结果满足用户期望(完全相同或者存在可容忍的偏差)，表明该预上线预测服务满足上线要求，可以部署到线上。

在将预上线预测服务转为线上预测服务的情况下，本公开还可以执行如下步骤中的至少一个：向用户提供线上预测服务的服务地址(如API服务地址)；向用户展示一条或多条预测数据的线上预测结果。其中，在向用户展示一条或多条预测数据的线上预测结果的情况下，还可以接收用户对预测数据中一个或多个字段值的修改，并展示修改后的预测数据的线上预测结果。其中，预测数据可以是线上实时生成的数据。

综上，本公开可以实现为一套模型上线流程，包括线上数据冷启动、模拟上线及应用上线，整个流程中可以通过可视化页面进行引导，降低用户操作成本。模拟上线是指在应用上线前进行环境校验及一致性校验，当满足系统约定的校验条件后，该应用支持直接部署上线。环境校验包括校验线上数据库是否可用、线上数据是否冷启动等，一致性校验则包括获取样例数据、针对样例数据进行离线预估打分、针对样例数据进行模拟预估打分、校验打分结果是否一致。

图7示出了模型上线流程示意性图。其中，线上数据冷启动和模拟上线作为本公开的要点已在上文做了详细描述，其他相关模块作为默认的组件能力不做详细描述。

如图7所示，用户可以在离线环境下进行模型训练，产出模型文件。当用户需要针对当前训练的模型部署实时应用上线时，可以进入应用管理页面创建实时预估应用模板，并选择当前训练的模型信息，应用模板会自动解析模型文件，获取模型训练过程中需要的数据表信息和特征构建脚本。

可以由页面引导用户根据解析结果进行线上数据冷启动，包括数据表创建和导数，相关流程会在数据管理页面统一进行。接着，用户需要配置补充补充信息，比如资源信息、日志信息等，然后将实时预估应用模块打包成预上线应用，并进入模拟上线流程。在模拟上线流程中，系统会自动校验当前环境是否满足上线要求，包括线上数据库是否可用、线上数据是否冷启动，然后用户可以自定义样例数据或选择系统提供的样例数据，分别进行离线模型的预估打分和预上线模型的模拟打分，通过对比两者数据是否一致来判定当前预上线应用是否满足上线要求，若满足用户可以直接进行上线，产生上线应用并提供外部可调用的API，从而完成全流程。关于模型上线流程的实现细节可以参见上文相关描述，此处不再赘述。

需要说明的是，本公开实施例中的所述的机器学习模型(如神经网络模型)可被用于预测图像类别、文本类别、语音情感、欺诈交易、广告点击率等。所述机器学习模型(如神经网络模型)旨在针对相关场景中的对象或事件有关的问题进行预测。例如，可用于预测图像类别、预测图像中文字、预测文本类别、预测语音情感类别、预测欺诈交易、预测广告点击率、预测商品价格等等，使得预测结果可直接作为决策依据或进一步结合其他规则而成为决策依据。

更进一步来说，本公开实施例中的机器学习模型(如神经网络模型)可被用于的场景包括但不限于以下场景：

图像处理场景，包括：光学字符识别OCR、人脸识别、物体识别和图片分类；更具体地举例来说，OCR可应用于票据(如发票)识别、手写字识别等，人脸识别可应用安防等领域，物体识别可应用于自动驾驶场景中的交通标志识别，图片分类可应用于电商平台的“拍照购”、“找同款”等。

语音识别场景，包括可通过语音进行人机交互的产品，如手机的语音助手(如苹果手机的Siri)、智能音箱等；

自然语言处理场景，包括：审查文本(如合同、法律文书和客服记录等)、垃圾内容识别(如垃圾短信识别)和文本分类(情感、意图和主题等)；

自动控制场景，包括：矿井组调节操作预测、风力发电机组调节操作预测和空调系统调节操作预测；具体的对于矿井组可预测开采率高的一组调节操作，对于风力发电机组可预测发电效率高的一组调节操作，对于空调系统，可以预测满足需求的同时节省能耗的一组调节操作；

智能问答场景，包括：聊天机器人和智能客服；

业务决策场景，包括：金融科技领域、医疗领域和市政领域的场景，其中：

金融科技领域包括：营销(如优惠券使用预测、广告点击行为预测、用户画像挖掘等)与获客、反欺诈、反洗钱、承保和信用评分、商品价格预测；

医疗领域包括：疾病筛查和预防、个性化健康管理和辅助诊断；

市政领域包括：社会治理与监管执法、资源环境和设施管理、产业发展和经济分析、公众服务和民生保障、智慧城市(公交、网约车、共享单车等各类城市资源的调配和管理)；

推荐业务场景，包括：新闻、广告、音乐、咨询、视频和金融产品(如理财、保险等)的推荐；

搜索场景，包括：网页搜索、图像搜索、文本搜索、视频搜索等；

异常行为检测场景，包括：国家电网客户用电异常行为检测、网络恶意流量检测、操作日志中的异常行为检测等。

本公开的辅助机器学习模型上线的方法，还可以实现为一种用于创建机器学习方案模板的装置。图8示出了根据本公开示例性实施例的辅助机器学习模型上线的装置的结构框图。其中，辅助机器学习模型上线的装置的功能单元可以由实现本公开原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是，图8所描述的功能单元可以组合起来或者划分成子单元，从而实现上述公开的原理。因此，本文的描述可以支持对本文描述的功能单元的任何可能的组合、或者划分、或者更进一步的限定。

下面就辅助机器学习模型上线的装置可以具有的功能单元以及各功能单元可以执行的操作做简要说明，对于其中涉及的细节部分可以参见上文相关描述，这里不再赘述。

参见图8，辅助机器学习模型上线的装置800包括获取模块810、第一确定模块820、创建模块830以及导入模块840。

获取模块810被配置为获取线下训练机器学习模型得到的模型文件。

第一确定模块820被配置为对模型文件进行解析，确定模型训练过程使用的训练数据表。作为示例，第一确定模块80可以通过对模型文件进行解析，得到模型训练过程信息，并根据模型训练过程信息，将特征处理步骤对应的输入表作为模型训练过程使用的训练数据表。模型训练过程信息可以包括但不限于以下至少一项：模型训练过程中的处理节点、处理节点对应的输入表、处理节点对应的输出表。

特征处理步骤包括字段名和针对字段名的特征处理方法，辅助机器学习模型上线的装置800还可以包括存储模块，被配置为根据特征处理步骤涉及的字段名，在线上数据库中以字段名为键存储线上数据表中的数据。

创建模块830被配置为在线上数据库中创建与训练数据表的表信息一致的线上数据表。

导入模块840被配置为将至少部分线下数据导入线上数据表。作为示例，辅助机器学习模型上线的装置800还可以包括第二确定模块，被配置为通过对模型文件进行解析，确定特征处理步骤针对的数据范围，导入模块840可以将对应于数据范围的线下数据导入线上数据表。

辅助机器学习模型上线的装置800还可以包括部署模块、第一预测模块、第二预测模块以及第一上线模块。部署模块被配置为部署用于实现机器学习模型的预测功能的预上线预测服务；第一预测模块被配置为利用预上线预测服务对待预测数据进行预测得到第一预测结果；第二预测模块被配置为在线下环境中对待预测数据进行预测得到第二预测结果；比较模块被配置为比较第一预测结果和第二预测结果；第一上线模块被配置为根据第一预测结果和第二预测结果之间的差异，确定是否上线预上线预测服务。

第二预测模块可以通过对模型文件进行解析，确定下游执行算子和模型预测算子，下游执行算子用于表征待预测数据在模型预测之前需要执行的操作；将待预测数据输入下游执行算子；将下游执行算子的输出输入模型预测算子，模型预测算子的输出即为对待预测数据进行预测得到的第二预测结果。

作为示例，辅助机器学习模型上线的装置800还可以包括呈现模块和接收模块。呈现模块被配置为向用户提供用于设置线上预测服务的图形界面；接收模块被配置为接收用户通过图形界面选择的预上线预测服务；其中，获取模块810可以执行如下操作中的至少一个：获取服务器端存储的与预上线预测服务对应的模型文件；接收用户上传的模型文件。

在一个实施例中，呈现模块还可以被配置为执行如下操作中的至少一个：在图形界面中展示模型效果；在图形界面中展示线上数据表。

在一个实施例中，呈现模块还可以在图形界面中展示向用户推荐的资源配置信息。

在一个实施例中，接收模块还可以接收用户通过图形界面设置的资源配置信息。

辅助机器学习模型上线的装置800还可以包括第一校验模块，被配置为在预上线预测服务设置完成后，校验预上线预测服务的当前环境是否满足上线要求。

辅助机器学习模型上线的装置800还可以包括第二校验模块和第二上线模块。第二校验模块被配置为在当前环境满足上线要求的情况下，校验预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致；第二上线模块被配置为在预上线预测服务的预测性能与线下环境中机器学习模型的预测性能一致或基本一致的情况下，将预上线预测服务转为线上预测服务。

作为示例，第二校验模块可以被配置为：获取用户指定的样例数据以及输出字段；启动用于模拟线下运行环境的离线预估任务和用于模拟线上运行环境的模拟预估任务，分别对样例数据进行预测；比较离线预估任务和模拟预估任务针对输出字段的输出结果是否一致。

呈现模块还向用户提供服务详情页，服务详情页用于展示预上线预测服务的以下至少一项服务信息：基本参数、模型参数、一致性校验结果、服务状态信息。关于各项服务信息的具体内容可以参见上文相关描述。

作为示例，辅助机器学习模型上线的装置800还可以包括提供模块。提供模块被配置为在将预上线预测服务转为线上预测服务的情况下执行如下操作中的至少一个：向用户提供线上预测服务的服务地址；向用户展示一条或多条预测数据的线上预测结果。其中，接收模块还可以接收用户对预测数据中一个或多个字段值的修改；呈现模块还可以展示修改后的预测数据的线上预测结果。

应该理解，根据本公开示例性实施例的辅助机器学习模型上线的装置800的具体实现方式可参照上文结合图1至图7针对辅助机器学习模型上线的方法的相关描述来实现，在此不再赘述。

以上参照图1到图8描述了根据本公开示例性实施例的辅助机器学习模型上线的方法及装置。应理解，上述方法可通过记录在计算可读介质上的程序来实现，例如，根据本公开的示例性实施例，可提供一种存储指令的计算机可读存储介质，其中，在所述计算机可读存储介质上记录有用于执行本公开的辅助机器学习模型上线的方法(例如图1所示)的计算机程序。

上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行，应注意，所述计算机程序除了可用于执行除了图1示出的步骤之外，还可用于执行除了上述步骤以外的附加步骤或者在执行上述步骤时执行更为具体的处理，这些附加步骤和进一步处理的内容已经参照图1进行了描述，这里为了避免重复将不再进行赘述。

应注意，根据本公开示例性实施例的辅助机器学习模型上线的装置，可完全依赖计算机程序的运行来实现相应的功能，即，各个装置与计算机程序的功能架构中与各步骤相应，使得整个装置通过专门的软件包(例如，lib库)而被调用，以实现相应的功能。

另一方面，图8所示的各个装置也可以通过硬件、软件、固件、中间件、微代码或其任意组合来实现。当以软件、固件、中间件或微代码实现时，用于执行相应操作的程序代码或者代码段可以存储在诸如存储介质的计算机可读存储介质中，使得处理器可通过读取并运行相应的程序代码或者代码段来执行相应的操作。

例如，本公开的示例性实施例还可以实现为计算装置，该计算装置包括存储部件和处理器，存储部件中存储有计算机可执行指令集合，当所述计算机可执行指令集合被所述处理器执行时，执行辅助机器学习模型上线的方法。

存储部件也即存储器。使处理器执行上文述及的辅助机器学习模型上线的方法，也即使处理器执行如下步骤：获取线下训练机器学习模型得到的模型文件；对所述模型文件进行解析，确定模型训练过程使用的训练数据表；在线上数据库中创建与所述训练数据表的表信息一致的线上数据表；将至少部分线下数据导入所述线上数据表。

确定模型训练过程使用的训练数据表的步骤可以包括：通过对所述模型文件进行解析，得到模型训练过程信息；根据所述模型训练过程信息，将特征处理步骤对应的输入表作为模型训练过程使用的训练数据表。

所述模型训练过程信息可以包括以下至少一项：模型训练过程中的处理节点、所述处理节点对应的输入表、所述处理节点对应的输出表。

所述特征处理步骤可以包括字段名和针对所述字段名的特征处理方法，使处理器执行的步骤还可以包括以下步骤：根据所述特征处理步骤涉及的字段名，在线上数据库中以所述字段名为键存储所述线上数据表中的数据。

处理器执行的步骤还可以包括如下步骤：通过对所述模型文件进行解析，确定特征处理步骤针对的数据范围，其中，将至少部分线下数据导入所述线上数据表的步骤可以包括：将对应于所述数据范围的线下数据导入所述线上数据表。

处理器执行的步骤还可以包括如下步骤：部署用于实现所述机器学习模型的预测功能的预上线预测服务；利用所述预上线预测服务对待预测数据进行预测得到第一预测结果；在线下环境中对所述待预测数据进行预测得到第二预测结果；比较所述第一预测结果和所述第二预测结果；根据所述第一预测结果和所述第二预测结果之间的差异，确定是否上线所述预上线预测服务。

在线下环境中对所述待预测数据进行预测得到第二预测结果的步骤可以包括：通过对所述模型文件进行解析，确定下游执行算子和模型预测算子，所述下游执行算子用于表征所述待预测数据在模型预测之前需要执行的操作；将所述待预测数据输入所述下游执行算子；将所述下游执行算子的输出输入所述模型预测算子，所述模型预测算子的输出即为对所述待预测数据进行预测得到的第二预测结果。

处理器执行的步骤还可以包括：向用户提供用于设置线上预测服务的图形界面；接收用户通过所述图形界面选择的预上线预测服务；其中，获取线下训练机器学习模型得到的模型文件的步骤包括如下步骤中的至少一个：获取服务器端存储的与所述预上线预测服务对应的模型文件；接收用户上传的模型文件。

处理器执行的步骤还可以包括如下步骤中的至少一个：在所述图形界面中展示模型效果；在所述图形界面中展示所述线上数据表。

处理器执行的步骤还可以包括如下步骤中的至少一个：在所述图形界面中展示向用户推荐的资源配置信息；接收用户通过所述图形界面设置的资源配置信息。

处理器执行的步骤还可以包括：在设置完成后，校验所述预上线预测服务的当前环境是否满足上线要求。

处理器执行的步骤还可以包括：在所述当前环境满足上线要求的情况下，校验所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致；在所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能一致或基本一致的情况下，将所述预上线预测服务转为线上预测服务。

校验所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致的步骤可以包括：获取用户指定的样例数据以及输出字段；启动用于模拟线下运行环境的离线预估任务和用于模拟线上运行环境的模拟预估任务，分别对所述样例数据进行预测；比较所述离线预估任务和所述模拟预估任务针对所述输出字段的输出结果是否一致。

处理器执行的步骤还可以包括：向用户提供服务详情页，所述服务详情页用于展示所述预上线预测服务的以下至少一项服务信息：基本参数、模型参数、一致性校验结果、服务状态信息。

所述基本参数可以包括以下至少一项：服务名称、服务类型、运行状态、部署时间、运行时间、资源参数。

所述模型参数可以包括以下至少一项：模型名称、模型类型、模型准确率、对数损失值。

所述一致性校验结果可以包括一条或多条预测数据分别在线上环境中的预测结果和线下环境中的打分结果。

所述服务状态信息可以包括以下至少一项：性能指标、日志信息和运行状态监控信息。

处理器执行的步骤还可以包括：在将所述预上线预测服务转为线上预测服务的情况下，向用户提供线上预测服务的服务地址。

处理器执行的步骤还可以包括：在将所述预上线预测服务转为线上预测服务的情况下，向用户展示一条或多条预测数据的线上预测结果。

处理器执行的步骤还可以包括：接收用户对所述预测数据中一个或多个字段值的修改；以及展示修改后的预测数据的线上预测结果。

具体说来，所述计算装置可以部署在服务器或客户端中，也可以部署在分布式网络环境中的节点装置上。此外，所述计算装置可以是PC计算机、平板装置、个人数字助理、智能手机、web应用或其他能够执行上述指令集合的装置。

这里，所述计算装置并非必须是单个的计算装置，还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。计算装置还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子装置。

在所述计算装置中，处理器可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。

根据本公开示例性实施例的辅助机器学习模型上线的方法中所描述的某些操作可通过软件方式来实现，某些操作可通过硬件方式来实现，此外，还可通过软硬件结合的方式来实现这些操作。

处理器可运行存储在存储部件之一中的指令或代码，其中，所述存储部件还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，所述网络接口装置可采用任何已知的传输协议。

存储部件可与处理器集成为一体，例如，将RAM或闪存布置在集成电路微处理器等之内。此外，存储部件可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储部件和处理器可在操作上进行耦合，或者可例如通过I/O端口、网络连接等互相通信，使得处理器能够读取存储在存储部件中的文件。

此外，所述计算装置还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。计算装置的所有组件可经由总线、网络中的至少一个而彼此连接。

根据本公开示例性实施例的辅助机器学习模型上线的方法所涉及的操作可被描述为各种互联或耦合的功能块或功能示图。然而，这些功能块或功能示图可被均等地集成为单个的逻辑装置或按照非确切的边界进行操作。

例如，如上所述，根据本公开示例性实施例的辅助机器学习模型上线的的装置可包括存储部件和处理器，其中，存储部件中存储有计算机可执行指令集合，当所述计算机可执行指令集合被所述处理器执行时，执行上文述及的辅助机器学习模型上线的方法。

以上描述了本公开的各示例性实施例，应理解，上述描述仅是示例性的，并非穷尽性的，本公开不限于所披露的各示例性实施例。在不偏离本公开的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。因此，本公开的保护范围应该以权利要求的范围为准。

Claims

一种辅助机器学习模型上线的方法，包括：

获取线下训练机器学习模型得到的模型文件；

对所述模型文件进行解析，确定模型训练过程使用的训练数据表；

在线上数据库中创建与所述训练数据表的表信息一致的线上数据表；

将至少部分线下数据导入所述线上数据表。
根据权利要求1所述的方法，其中，确定模型训练过程使用的训练数据表的步骤包括：

通过对所述模型文件进行解析，得到模型训练过程信息；

根据所述模型训练过程信息，将特征处理步骤对应的输入表作为模型训练过程使用的训练数据表。
根据权利要求2所述的方法，其中，所述模型训练过程信息包括以下至少一项：模型训练过程中的处理节点、所述处理节点对应的输入表、所述处理节点对应的输出表。
根据权利要求2所述的方法，其中，所述特征处理步骤包括字段名和针对所述字段名的特征处理方法，该方法还包括：

根据所述特征处理步骤涉及的字段名，在线上数据库中以所述字段名为键存储所述线上数据表中的数据。
根据权利要求1所述的方法，还包括：

通过对所述模型文件进行解析，确定特征处理步骤针对的数据范围，

其中，将至少部分线下数据导入所述线上数据表的步骤包括：将对应于所述数据范围的线下数据导入所述线上数据表。
根据权利要求1所述的方法，还包括：

部署用于实现所述机器学习模型的预测功能的预上线预测服务；

利用所述预上线预测服务对待预测数据进行预测得到第一预测结果；

在线下环境中对所述待预测数据进行预测得到第二预测结果；

比较所述第一预测结果和所述第二预测结果；

根据所述第一预测结果和所述第二预测结果之间的差异，确定是否上线所述预上线预测服务。
根据权利要求6所述的方法，其中，在线下环境中对所述待预测数据进行预测得到第二预测结果的步骤包括：

通过对所述模型文件进行解析，确定下游执行算子和模型预测算子，所述下游执行算子用于表征所述待预测数据在模型预测之前需要执行的操作；

将所述待预测数据输入所述下游执行算子；

将所述下游执行算子的输出输入所述模型预测算子，所述模型预测算子的输出即为对所述待预测数据进行预测得到的第二预测结果。
根据权利要求1所述的方法，还包括：

向用户提供用于设置线上预测服务的图形界面；

接收用户通过所述图形界面选择的预上线预测服务；

其中，获取线下训练机器学习模型得到的模型文件的步骤包括如下步骤中的至少一个：获取服务器端存储的与所述预上线预测服务对应的模型文件；接收用户上传的模型文件。
根据权利要求8所述的方法，还包括如下步骤中的至少一个：

在所述图形界面中展示模型效果；

在所述图形界面中展示所述线上数据表。
根据权利要求8所述的方法，还包括如下步骤中的至少一个：

在所述图形界面中展示向用户推荐的资源配置信息；

接收用户通过所述图形界面设置的资源配置信息。
根据权利要求8所述的方法，还包括：

在设置完成后，校验所述预上线预测服务的当前环境是否满足上线要求。
根据权利要求11所述的方法，还包括：

在所述当前环境满足上线要求的情况下，校验所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致；

在所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能一致或基本一致的情况下，将所述预上线预测服务转为线上预测服务。
根据权利要求12所述的方法，其中，校验所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致的步骤包括：

获取用户指定的样例数据以及输出字段；

启动用于模拟线下运行环境的离线预估任务和用于模拟线上运行环境的模拟预估任务，分别对所述样例数据进行预测；

比较所述离线预估任务和所述模拟预估任务针对所述输出字段的输出结果是否一致。
根据权利要求12所述的方法，还包括：

向用户提供服务详情页，所述服务详情页用于展示所述预上线预测服务的以下至少一项服务信息：基本参数、模型参数、一致性校验结果、服务状态信息。
根据权利要求14所述的方法，其中，

所述基本参数包括以下至少一项：服务名称、服务类型、运行状态、部署时间、运行时间、资源参数。
根据权利要求14所述的方法，其中，

所述模型参数包括以下至少一项：模型名称、模型类型、模型准确率、对数损失值。
根据权利要求14所述的方法，其中，

所述一致性校验结果包括一条或多条预测数据分别在线上环境中的预测结果和线下环境中的打分结果。
根据权利要求14所述的方法，其中，

所述服务状态信息包括以下至少一项：性能指标、日志信息和运行状态监控信息。
根据权利要求12所述的方法，还包括：

在将所述预上线预测服务转为线上预测服务的情况下，向用户提供线上预测服务的服务地址。
根据权利要求12所述的方法，还包括：

在将所述预上线预测服务转为线上预测服务的情况下，向用户展示一条或多条预测数据的线上预测结果。
根据权利要求19所述的方法，还包括：

接收用户对所述预测数据中一个或多个字段值的修改；以及

展示修改后的预测数据的线上预测结果。
一种辅助机器学习模型上线的装置，包括：

获取模块，被配置为获取线下训练机器学习模型得到的模型文件；

第一确定模块，被配置为对所述模型文件进行解析，确定模型训练过程使用的训练数据表；

创建模块，被配置为在线上数据库中创建与所述训练数据表的表信息一致的线上数据表；

导入模块，被配置为将至少部分线下数据导入所述线上数据表。
根据权利要求22所述的装置，其中，所述第一确定模块被配置为：

通过对所述模型文件进行解析，得到模型训练过程信息；

根据所述模型训练过程信息，将特征处理步骤对应的输入表作为模型训练过程使用的训练数据表。
根据权利要求23所述的装置，其中，所述模型训练过程信息包括以下至少一项：模型训练过程中的处理节点、所述处理节点对应的输入表、所述处理节点对应的输出表。
根据权利要求23所述的装置，其中，所述特征处理步骤包括字段名和针对所述字段名的特征处理方法，该装置还包括：

存储模块，被配置为根据所述特征处理步骤涉及的字段名，在线上数据库中以所述字段名为键存储所述线上数据表中的数据。
根据权利要求22所述的装置，还包括：

第二确定模块，被配置为通过对所述模型文件进行解析，确定特征处理步骤针对的数据范围，

其中，所述导入模块将对应于所述数据范围的线下数据导入所述线上数据表。
根据权利要求22所述的装置，还包括：

部署模块，被配置为部署用于实现所述机器学习模型的预测功能的预上线预测服务；

第一预测模块，被配置为利用所述预上线预测服务对待预测数据进行预测得到第一预测结果；

第二预测模块，被配置为在线下环境中对所述待预测数据进行预测得到第二预测结果；

比较模块，被配置为比较所述第一预测结果和所述第二预测结果；

第一上线模块，被配置为根据所述第一预测结果和所述第二预测结果之间的差异，确定是否上线所述预上线预测服务。
根据权利要求27所述的装置，其中，所述第二预测模块被配置为：

通过对所述模型文件进行解析，确定下游执行算子和模型预测算子，所述下游执行算子用于表征所述待预测数据在模型预测之前需要执行的操作；

将所述待预测数据输入所述下游执行算子；

将所述下游执行算子的输出输入所述模型预测算子，所述模型预测算子的输出即为对所述待预测数据进行预测得到的第二预测结果。
根据权利要求22所述的装置，还包括：

呈现模块，被配置为向用户提供用于设置线上预测服务的图形界面；

接收模块，被配置为接收用户通过所述图形界面选择的预上线预测服务；

其中，所述获取模块被配置为执行如下操作中的至少一个：获取服务器端存储的与所述预上线预测服务对应的模型文件；收用户上传的模型文件。
根据权利要求29所述的装置，其中，所述呈现模块被配置为执行如下操作中的至少一个：

在所述图形界面中展示模型效果；

在所述图形界面中展示所述线上数据表。
根据权利要求29所述的装置，其中，

所述呈现模块还在所述图形界面中展示向用户推荐的资源配置信息。
根据权利要求29所述的装置，其中，

所述接收模块还接收用户通过所述图形界面设置的资源配置信息。
根据权利要求29所述的装置，还包括：

第一校验模块，被配置为在预上线预测服务设置完成后，校验所述预上线预测服务的当前环境是否满足上线要求。
根据权利要求33所述的装置，还包括：

第二校验模块，被配置为在所述当前环境满足上线要求的情况下，校验所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致；

第二上线模块，被配置为在所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能一致或基本一致的情况下，将所述预上线预测服务转为线上预测服务。
根据权利要求34所述的装置，其中，所述第二校验模块被配置为：

获取用户指定的样例数据以及输出字段；

启动用于模拟线下运行环境的离线预估任务和用于模拟线上运行环境的模拟预估任务，分别对所述样例数据进行预测；

比较所述离线预估任务和所述模拟预估任务针对所述输出字段的输出结果是否一致。
根据权利要求34所述的装置，其中，

所述呈现模块还向用户提供服务详情页，所述服务详情页用于展示所述预上线预测服务的以下至少一项服务信息：基本参数、模型参数、一致性校验结果、服务状态信息。
根据权利要求36所述的装置，其中，

所述基本参数包括以下至少一项：服务名称、服务类型、运行状态、部署时间、运行时间、资源参数。
根据权利要求36所述的装置，其中，

所述模型参数包括以下至少一项：模型名称、模型类型、模型准确率、对数损失值。
根据权利要求36所述的装置，其中，

所述一致性校验结果包括一条或多条预测数据分别在线上环境中的预测结果和线下环境中的打分结果。
根据权利要求36所述的装置，其中，

所述服务状态信息包括以下至少一项：性能指标、日志信息和运行状态监控信息。
根据权利要求34所述的装置，还包括：

提供模块，被配置为在将所述预上线预测服务转为线上预测服务的情况下执行如下操作中的至少一个：向用户提供线上预测服务的服务地址；向用户展示一条或多条预测数据的线上预测结果。
根据权利要求41所述的装置，其中，

所述接收模块还接收用户对所述预测数据中一个或多个字段值的修改；

所述呈现模块还展示修改后的预测数据的线上预测结果。
一种包括至少一个计算装置和至少一个存储指令的存储装置的系统，其中，所述指令在被所述至少一个计算装置运行时，促使所述至少一个计算装置执行如权利要求1到21中的任一权利要求所述的方法。
一种存储指令的计算机可读存储介质，其中，当所述指令被至少一个计算装置运行时，促使所述至少一个计算装置执行如权利要求1到21中的任一权利要求所述的方法。
一种计算装置，包括处理器和存储器，所述存储器中存储有计算机可执行指令集合，当所述计算机可执行指令集合被所述处理器执行时，使所述处理器执行如下步骤：

获取线下训练机器学习模型得到的模型文件；

对所述模型文件进行解析，确定模型训练过程使用的训练数据表；

在线上数据库中创建与所述训练数据表的表信息一致的线上数据表；

将至少部分线下数据导入所述线上数据表。
根据权利要求45所述的计算装置，其中，确定模型训练过程使用的训练数据表的步骤包括：

通过对所述模型文件进行解析，得到模型训练过程信息；

根据所述模型训练过程信息，将特征处理步骤对应的输入表作为模型训练过程使用的训练数据表。
根据权利要求46所述的计算装置，其中，所述模型训练过程信息包括以下至少一项：模型训练过程中的处理节点、所述处理节点对应的输入表、所述处理节点对应的输出表。
根据权利要求46所述的计算装置，其中，所述特征处理步骤包括字段名和针对所述字段名的特征处理方法，还包括以下步骤：

根据所述特征处理步骤涉及的字段名，在线上数据库中以所述字段名为键存储所述线上数据表中的数据。
根据权利要求45所述的计算装置，其中，还包括如下步骤：

通过对所述模型文件进行解析，确定特征处理步骤针对的数据范围，

其中，将至少部分线下数据导入所述线上数据表的步骤包括：将对应于所述数据范围的线下数据导入所述线上数据表。
根据权利要求45所述的计算装置，其中，还包括如下步骤：

部署用于实现所述机器学习模型的预测功能的预上线预测服务；

利用所述预上线预测服务对待预测数据进行预测得到第一预测结果；

在线下环境中对所述待预测数据进行预测得到第二预测结果；

比较所述第一预测结果和所述第二预测结果；

根据所述第一预测结果和所述第二预测结果之间的差异，确定是否上线所述预上线预测服务。
根据权利要求50所述的计算装置，其中，在线下环境中对所述待预测数据进行预测得到第二预测结果的步骤包括：

通过对所述模型文件进行解析，确定下游执行算子和模型预测算子，所述下游执行算子用于表征所述待预测数据在模型预测之前需要执行的操作；

将所述待预测数据输入所述下游执行算子；

将所述下游执行算子的输出输入所述模型预测算子，所述模型预测算子的输出即为对所述待预测数据进行预测得到的第二预测结果。
根据权利要求45所述的计算装置，其中，还包括如下步骤：

向用户提供用于设置线上预测服务的图形界面；

接收用户通过所述图形界面选择的预上线预测服务；

其中，获取线下训练机器学习模型得到的模型文件的步骤包括如下步骤中的至少一个：获取服务器端存储的与所述预上线预测服务对应的模型文件；接收用户上传的模型文件。
根据权利要求52所述的计算装置，还包括如下步骤中的至少一个：

在所述图形界面中展示模型效果；

在所述图形界面中展示所述线上数据表。
根据权利要求52所述的计算装置，其中，还包括如下步骤中的至少一个：

在所述图形界面中展示向用户推荐的资源配置信息；

接收用户通过所述图形界面设置的资源配置信息。
根据权利要求52所述的计算装置，其中，还包括如下步骤：

在设置完成后，校验所述预上线预测服务的当前环境是否满足上线要求。
根据权利要求55所述的计算装置，其中，还包括如下步骤：

在所述当前环境满足上线要求的情况下，校验所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致；

在所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能一致或基本一致的情况下，将所述预上线预测服务转为线上预测服务。
根据权利要求56所述的计算装置，其中，校验所述预上线预测服务的预测性能与线下环境中机器学习模型的预测性能是否一致的步骤包括：

获取用户指定的样例数据以及输出字段；

启动用于模拟线下运行环境的离线预估任务和用于模拟线上运行环境的模拟预估任务，分别对所述样例数据进行预测；

比较所述离线预估任务和所述模拟预估任务针对所述输出字段的输出结果是否一致。
根据权利要求56所述的计算装置，其中，还包括如下步骤：

向用户提供服务详情页，所述服务详情页用于展示所述预上线预测服务的以下至少一项服务信息：基本参数、模型参数、一致性校验结果、服务状态信息。
根据权利要求58所述的计算装置，其中，

所述基本参数包括以下至少一项：服务名称、服务类型、运行状态、部署时间、运行时间、资源参数。
根据权利要求58所述的计算装置，其中，

所述模型参数包括以下至少一项：模型名称、模型类型、模型准确率、对数损失值。
根据权利要求58所述的计算装置，其中，

所述一致性校验结果包括一条或多条预测数据分别在线上环境中的预测结果和线下环境中的打分结果。
根据权利要求58所述的计算装置，其中，

所述服务状态信息包括以下至少一项：性能指标、日志信息和运行状态监控信息。
根据权利要求56所述的计算装置，还包括：

在将所述预上线预测服务转为线上预测服务的情况下，向用户提供线上预测服务的服务地址。
根据权利要求56所述的计算装置，还包括：

在将所述预上线预测服务转为线上预测服务的情况下，向用户展示一条或多条预测数据的线上预测结果。
根据权利要求63所述的计算装置，还包括：

接收用户对所述预测数据中一个或多个字段值的修改；以及

展示修改后的预测数据的线上预测结果。