CN115564060A

CN115564060A - 机器学习模型的优化方法、装置及电子设备

Info

Publication number: CN115564060A
Application number: CN202211393923.9A
Authority: CN
Inventors: 蔡尚铭; 王庆龙; 刘峥
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba Cloud Computing Ltd
Priority date: 2022-11-08
Filing date: 2022-11-08
Publication date: 2023-01-03

Abstract

本申请提供了一种机器学习模型的优化方法、装置及电子设备，涉及云计算和智能运维技术领域，依据本申请实施例，在机器学习模型变更时，可以获取机器学习模型的配置文件和训练样本数据，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境，使机器学习模型可以在运行环境中自动进行训练，将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。不需要人工针对机器学习模型的变更修改各个流程相关源代码，降低了智能运维场景下机器学习模型迭代的人力与时间成本，提高了迭代效率。

Description

机器学习模型的优化方法、装置及电子设备

技术领域

本申请涉及云计算和智能运维技术领域，尤其涉及一种机器学习模型的优化方法、装置及电子设备。

背景技术

人工智能和机器学习技术正在改变整个产业界，在云服务的构建和运维方面也是如此。智能运维(Artificial Intelligence for IT Operations，AIOps)是人工智能与运维相结合的产物，通过应用机器学习技术，对海量运维数据(包括日志、业务数据、系统数据等)进行实时或离线分析，加强信息技术(Information Technology，IT)运营分析能力。

在智能运维领域中，为了提高机器学习模型的分析准确率与运行效率，需要对所使用的多种机器学习模型进行迭代与调优。在当前的各类方案中，整个智能运维场景中所涉及到的每个机器学习模型的变更都需要在开发人员的参与下修改整个流程相关源代码才能得到反馈，这在很大程度上提高了智能运维场景下机器学习模型迭代的开发时间成本与人力成本。

发明内容

本申请实施例提供一种机器学习模型的优化方法、装置及电子设备，以降低智能运维场景下机器学习模型迭代的人力与时间成本，提高迭代效率。

第一方面，本申请实施例提供了一种机器学习模型的优化方法，该方法包括：

获取机器学习模型的配置文件和训练样本数据；配置文件包括机器学习模型的样本特征配置文件和模型配置文件；

基于配置文件，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境；

在运行环境中，利用训练样本特征训练机器学习模型，得到机器学习模型的训练结果相关数据；

将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。

第二方面，本申请实施例提供了一种机器学习模型的优化装置，该装置包括：

获取模块，用于获取机器学习模型的配置文件和训练样本数据；配置文件包括机器学习模型的样本特征配置文件和模型配置文件；

确定模块，用于基于配置文件，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境；

训练模块，用于在运行环境中，利用训练样本特征训练机器学习模型，得到机器学习模型的训练结果相关数据；

提供模块，用于将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。

第三方面，本申请实施例提供了一种电子设备，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器在执行所述计算机程序时实现上述任一项所述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法。

与现有技术相比，本申请具有如下优点：

本申请实施例提供了一种机器学习模型的优化方法、装置及电子设备，在机器学习模型变更时，可以获取机器学习模型的配置文件和训练样本数据，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境，使机器学习模型可以在运行环境中自动进行训练，将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。不需要人工针对机器学习模型的变更修改各个流程相关源代码，降低了智能运维场景下机器学习模型迭代的人力与时间成本，提高了迭代效率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，可依照说明书的内容予以实施，并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本申请的一些实施方式，而不应将其视为是对本申请范围的限制。

图1为本申请提供的机器学习模型的优化的场景示意图；

图2为本申请一实施例的生成配置文件的示意图；

图3是本申请一实施例的机器学习模型的优化方法的流程图；

图4是本申请一实施例的机器学习模型的优化方法的流程图；

图5是本申请一实施例的机器学习模型的优化装置的结构框图；以及

图6为用来实现本申请实施例的电子设备的框图。

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本申请的构思或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的，而非限制性的。

为便于理解本申请实施例的技术方案，以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合，其均属于本申请实施例的保护范围。

图1为示例性的用于实现本申请实施例的方法的一个应用场景的示意图。本申请实施例可以应用于智能运维场景下的机器学习运维场景，机器学习运维(MachineLearning Operations，MLOps)是指机器学习系统开发和机器学习系统运营的有机统一，在机器学习模型构建流程的各个步骤(包括集成、测试、发布、部署)中实现自动化。本实施例具体可以通过机器学习运维系统的形式来实现，可以将机器学习运维系统部署在一个独立的服务器中，也可以和机器学习模型部署在同一个服务器中。其中涉及的机器学习模型可以用于故障检测和根因分析。其中，控制流表示控制指令等，数据流表示配置文件等数据。机器学习模型可以包括支持向量机模型、决策树模型、神经网络模型等。本实施例中的机器学习运维系统，包括：配置加载器，主控进程和监测服务器。配置加载器实时监测与读取机器学习模型的配置文件，加载和记录配置文件，通过配置文件的修改时间确定配置文件是否有更新，配置文件的变更会触发主控进程的对应接口，主控进程从配置文件中读取机器学习模型的多组超参数，利用配置文件和多组超参数(如图2中所示的“配置与参数”)分别配置机器学习模型，得到多个机器学习模型(如图2中所示的“运行实例”)和训练样本特征集合，并且根据配置文件生成每个运行实例对应的运行环境(如图2中所示的生成对应的虚拟环境或容器)，在相应的运行环境中，利用训练样本特征集合训练多个机器学习模型，完成机器学习模型的更新与迭代，将训练得到的指标结果、配置相关信息和模型的超参数，发送至监测服务器。监测服务器对指标结果等进行统计，并通过用户终端进行展示，并提供机器学习模型的导出与部署接口，进一步完善了下游对于机器学习模型的应用以及对机器学习模型进行优化，实现了智能运维场景下机器学习模型的生命周期管理。

其中，机器学习模型的配置文件如图2所示。配置文件包括机器学习运维系统运行时配置文件MLconfig、机器学习模板配置文件MLtemplate、样本特征配置文件MLfeature以及模型配置文件，模型配置文件包括模型参数配置文件MLmodel和模型环境配置文件MLproject。配置文件分别与机器学习运维系统的配置、数据版本、特征工程、模型工程、运行环境(例如，venv虚拟环境、conda环境或容器Dockerfile)及程序入口相关，配置文件可以是YAML格式或JSON格式等。其中，机器学习运维系统运行时配置文件MLconfig用于控制整个系统的各种运行时参数配置，包括当前应用任务入口、版本检查周期及并行度等，同时还记录了MLtemplate、MLfeature、MLmodel和MLproject的路径信息。模板配置文件MLtemplate是用于配置源日志数据的预处理规则的文件，其中包括数据版本信息，数据版本信息是表示训练样本数据的版本信息，对机器学习这类数据驱动型技术而言，不同版本数据所构建的模型的准确率也具有一定的区别。样本特征配置文件MLfeature是与特征工程相关的配置文件，特征工程(Feature Engineering)是指将原始数据转化成能更好表达问题本质的特征的过程，主要包括特征提取、特征构建和特征选择这三个子过程。模型参数配置文件MLmodel和模型环境配置文件MLproject是与模型工程相关的配置文件。模型工程涵盖机器学习模型从构建、训练与调优、模型部署、评估、使用到对机器学习模型的使用结果进行反馈和监测，以最小的代价保证机器学习模型全生命周期的标准化。本实施例中的机器学习运维系统仅需启动一次，后续数据版本、特征工程，以及模型工程的变更以及系统软件本身的设置都可以通过修改配置文件来实现。

本实施例中，通过将数据版本、特征生成规则及模型构建细节从实现代码中分离，并通过配置文件的方式传递到机器学习运维系统中，该机器学习运维系统可以定时检测数据版本、特征工程及模型工程等关键步骤的配置变更内容，自动进行机器学习模型的迭代与调优，不需要人工针对机器学习模型的变更配置各个流程，极大地降低了智能运维过程中的人力成本以及机器学习模型的迭代成本，提高迭代效率。在将机器学习模型应用于故障检测和根因分析时，可以提高故障检测和根因分析应用的性能优化迭代效率。

本申请实施例提供了一种机器学习模型的优化方法，如图3所示为本申请一实施例的机器学习模型的优化方法的流程图，可以包括：

步骤S301，获取机器学习模型的配置文件和训练样本数据；配置文件包括机器学习模型的样本特征配置文件和模型配置文件。

步骤S302，基于配置文件，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境。

步骤S303，在运行环境中，利用训练样本特征训练机器学习模型，得到机器学习模型的训练结果相关数据。

步骤S304，将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。

本申请实施例的执行主体可以为计算设备，例如，服务器。其中，获取机器学习模型的配置文件和训练样本数据的具体实现方式可以是按照预设时间周期自动获取，也可以是按照接收到的数据获取指令获取，本申请实施例对此不作限定。

其中，样本特征配置文件是与特征工程相关的配置文件，特征工程是指将原始数据转化成能更好表达问题本质的特征的过程，主要包括特征提取、特征构建和特征选择这三个子过程。模型配置文件包括模型参数配置文件和模型环境配置文件，是与模型工程相关的配置文件。模型工程涵盖机器学习模型从构建、训练与调优、模型部署、评估、使用到对机器学习模型的使用结果进行反馈和监测等多个步骤。配置文件的格式可以是YAML格式或JSON格式等。

利用配置文件配置机器学习模型训练所需要的数据，例如，机器学习模型、训练机器学习模型的训练样本集合，以及机器学习模型训练所需要的运行环境。其中，训练样本集合是对训练样本数据进行特征提取得到的训练样本特征的集合。

其中，运行环境可以是训练机器学习模型所需要的隔离环境，例如，venv虚拟环境、conda环境或容器Dockerfile等。

机器学习模型训练所需要的数据配置完成后，加载运行环境，利用训练样本特征训练机器学习模型，得到训练结果相关数据，将训练结果相关数据发送到用户终端进行展示，为进一步调整模型参数，优化模型提供参考。

本申请实施例提供了一种机器学习模型的优化方法，在机器学习模型变更时，可以获取机器学习模型的配置文件和训练样本数据，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境，使机器学习模型可以在运行环境中自动进行训练，将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。不需要人工针对机器学习模型的变更修改各个流程相关源代码，降低了智能运维场景下机器学习模型迭代的人力与时间成本，提高迭代效率。

其中，步骤S302中的机器学习模型的训练样本特征是通过以下方式得到的：

在一种实现方式中，基于配置文件，确定机器学习模型的训练样本特征，包括：从样本特征配置文件中获取样本特征生成规则，基于样本特征生成规则和训练样本数据，确定训练样本特征。

其中，利用配置文件中的样本特征配置文件配置样本特征生成规则，利用样本特征生成规则从训练样本数据中提取特征，从而得到训练样本特征。根据机器学习模型实现的功能不同，可以选择不同的训练样本数据，从而得到相应的训练样本特征，用于作为机器学习模型训练所需要的数据。

在一种实现方式中，基于配置文件，确定机器学习模型和机器学习模型的运行环境，包括：从模型配置文件中获取机器学习模型的超参数和运行环境相关信息；根据超参数确定机器学习模型，根据运行环境相关信息，确定机器学习模型的运行环境。

其中，模型配置文件包括参数配置文件和模型环境配置文件，模型配置文件是与模型工程相关的配置文件。参数配置文件用于配置机器学习模型的超参数，根据超参数可以确定具体的机器学习模型。模型环境配置文件用于配置机器学习模型的运行环境相关信息，包括构建何种类型运行环境以及程序入口函数等信息。运行环境的类型可以根据具体需要来确定，例如，根据不同的机器学习模型的需要，配置相应的venv虚拟环境、conda环境或容器Dockerfile等。

其中，从模型配置文件中获取机器学习模型的超参数和运行环境相关信息进一步见如下实施例：

在一种实现方式中，从模型配置文件中获取机器学习模型的超参数和运行环境相关信息，包括：从模型配置文件中获取机器学习模型的多组超参数和多组超参数分别对应的运行环境相关信息；根据超参数确定机器学习模型，根据运行环境相关信息，确定机器学习模型的运行环境，包括：根据多组超参数确定多个机器学习模型，根据多组超参数分别对应的运行环境相关信息，确定多个机器学习模型分别对应的运行环境，运行环境用于隔离多个机器学习模型。

其中，模型配置文件可以配置机器学习模型的多组超参数，根据多组超参数可以得到多个机器学习模型，根据多组超参数分别对应的运行环境相关信息，确定多个机器学习模型分别对应的运行环境，在各机器学习模型各自对应的运行环境中，完成更新与迭代。多个机器学习模型可以在各自的运行环境中并行训练，提高模型训练的效率。运行环境可以是虚拟环境或容器，通过应用虚拟环境及容器技术为每个机器学习模型构造独立的运行环境，实现各机器学习模型之间的隔离，可以使整个系统具有良好的稳定性。所产生的机器学习模型也具有可复现性及可移植性，适用于智能运维场景中的各种生产环境。

在一种实现方式中，获取机器学习模型的配置文件和训练样本数据，包括：按照预设时间周期获取配置文件和源日志数据，确定配置文件和源日志数据已更新；对源日志数据进行预处理，得到训练样本数据。

在实际应用中，按照预设的时间周期定期获取机器学习模型的配置文件和训练样本数据，根据配置文件和训练样本数据的修改时间，确定配置文件和源日志数据与之前的相比是否有更新，如果有更新，对源日志数据进行预处理，得到训练样本数据。预处理可以包括按照预处理规则对源日志数据进行清洗、抽取、匹配等。其中，预设的时间周期可以根据具体需要进行设定，例如，2秒、5秒。

在一种实现方式中，配置文件还包括模板配置文件；该方法还包括：从模板配置文件中获取训练样本数据的数据版本信息；结果相关数据包括数据版本信息。

在实际应用中，模板配置文件用于配置源日志数据的预处理规则的文件，其中包括数据版本信息，数据版本信息是表示训练样本数据的版本信息，对于机器学习模型，根据不同版本数据构建的模型的准确率不同。在对模型的训练结果进行展示时，可以将数据版本信息作为结果相关数据的一部分提供给用户，便于用户结合数据版本信息，确定模型的优化策略。

在一种实现方式中，将结果相关数据提供给用户，包括：将结果相关数据发送至监测服务器，监测服务器通过用户终端展示结果相关数据；结果相关数据包括机器学习模型的超参数和训练结果指标。

在实际应用中，可以通过监测服务器监测模型的训练过程和训练结果，将结果相关数据发送至监测服务器，监测服务器根据查询指令将结果相关数据发送至用户终端，通过用户终端的展示页面进行展示。其中，结果相关数据可以包括机器学习模型的训练结果相关的数据，例如，如果机器学习模型为分类模型，则训练结果相关数据可以包括分类准确率。如果该分类模型的上层应用为智能运维场景中的日志降噪任务，则训练结果相关数据还可以包括日志降噪的降噪率等。机器学习模型实现的功能不同，则结果相关数据不同。另外，结果相关数据还包括机器学习模型的超参数、数据版本信息以及配置文件版本等输入信息。

为了更加清楚的介绍本申请技术方案的技术思路，下面通过具体的实施例进行详细介绍。图4是本申请一实施例的一种机器学习模型的优化方法的流程图。该方法包括：

步骤S401，主控进程每隔一个时间周期检测所有配置文件以及源日志数据的最后修改时间。

步骤S402，判断配置文件以及源日志数据是否发生变动，如过是，则执行步骤S403-S407，否则，返回步骤S401。

步骤S403，主控进程对源日志数据进行数据预处理，并记录数据最后修改时间，同时从MLtemplate文件中读取数据版本信息。

步骤S404，从MLfeature文件中读取并加载特征抽取生成规则；从MLmodel文件中读取并加载机器学习模型的超参数。

步骤S405，从MLproject文件中读取并加载运行环境信息和程序入口，并生成所对应的虚拟环境或容器。

步骤S406，主控进程针对当前配置信息在虚拟环境或容器中训练和验证所对应的机器学习模型，并将参数、指标及分析结果发送至监测服务器。由于虚拟环境或容器隔离了每个机器学习模型的运行环境，针对不同配置及超参数选择，多个机器学习模型可以并行训练。

步骤S407，监测服务器通过用户终端展示参数、指标及分析结果，并提供机器学习模型部署与管理接口；主控进程回到步骤S401，重新执行整个过程。

与本申请实施例提供的方法的应用场景以及方法相对应地，本申请实施例还提供一种机器学习模型的优化装置。如图5所示为本申请一实施例的机器学习模型的优化装置的结构框图，可以包括：

获取模块501，用于获取机器学习模型的配置文件和训练样本数据；配置文件包括机器学习模型的样本特征配置文件和模型配置文件；

确定模块502，用于基于配置文件，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境；

训练模块503，用于在运行环境中，利用训练样本特征训练机器学习模型，得到机器学习模型的训练结果相关数据；

提供模块504，用于将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。

本申请实施例提供了一种机器学习模型的优化装置，在机器学习模型变更时，可以获取机器学习模型的配置文件和训练样本数据，确定机器学习模型、机器学习模型的训练样本特征和机器学习模型的运行环境，使机器学习模型可以在运行环境中自动进行训练，将结果相关数据提供给用户，以用于为机器学习模型的优化提供参考。不需要人工针对机器学习模型的变更修改各个流程相关源代码，降低了智能运维场景下机器学习模型迭代的人力与时间成本，提高了迭代效率。

在一种实现方式中，确定模块502在基于配置文件，确定机器学习模型的训练样本特征时，用于：从样本特征配置文件中获取样本特征生成规则，基于样本特征生成规则和训练样本数据，确定训练样本特征。

在一种实现方式中，确定模块502在基于配置文件，确定机器学习模型和机器学习模型的运行环境时，用于：从模型配置文件中获取机器学习模型的超参数和运行环境相关信息；根据超参数确定机器学习模型，根据运行环境相关信息，确定机器学习模型的运行环境。

在一种实现方式中，获取模块502在从模型配置文件中获取机器学习模型的超参数和运行环境相关信息时，用于：从模型配置文件中获取机器学习模型的多组超参数和多组超参数分别对应的运行环境相关信息；确定模块502在根据超参数确定机器学习模型，根据运行环境相关信息，确定机器学习模型的运行环境时，用于：根据多组超参数确定多个机器学习模型，根据多组超参数分别对应的运行环境相关信息，确定多个机器学习模型分别对应的运行环境，运行环境用于隔离多个机器学习模型。

在一种实现方式中，获取模块501，用于：按照预设时间周期获取配置文件和源日志数据，确定配置文件和源日志数据已更新；对源日志数据进行预处理，得到训练样本数据。

在一种实现方式中，配置文件还包括模板配置文件；装置还用于：从模板配置文件中获取训练样本数据的数据版本信息；结果相关数据包括数据版本信息。

在一种实现方式中，提供模块504，用于：将结果相关数据发送至监测服务器，监测服务器通过用户终端展示结果相关数据；结果相关数据包括机器学习模型的超参数和训练结果指标。

本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述，并具备相应的有益效果，在此不再赘述。

图6为用来实现本申请实施例的电子设备的框图。如图6所示，该电子设备包括：存储器610和处理器620，存储器610内存储有可在处理器620上运行的计算机程序。处理器620执行该计算机程序时实现上述实施例中的方法。存储器610和处理器620的数量可以为一个或多个。

该电子设备还包括：

通信接口630，用于与外界设备进行通信，进行数据交互传输。

如果存储器610、处理器620和通信接口630独立实现，则存储器610、处理器620和通信接口630可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture，EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器610、处理器620及通信接口630集成在一块芯片上，则存储器610、处理器620及通信接口630可以通过内部接口完成相互间的通信。

本申请实施例提供了一种计算机可读存储介质，其存储有计算机程序，该程序被处理器执行时实现本申请实施例中提供的方法。

本申请实施例还提供了一种芯片，该芯片包括处理器，用于从存储器中调用并运行存储器中存储的指令，使得安装有芯片的通信设备执行本申请实施例提供的方法。

本申请实施例还提供了一种芯片，包括：输入接口、输出接口、处理器和存储器，输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连，处理器用于执行存储器中的代码，当代码被执行时，处理器用于执行申请实施例提供的方法。

应理解的是，上述处理器可以是中央处理器(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(FieldProgrammable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是，处理器可以是支持进阶精简指令集机器(Advanced RISC Machines，ARM)架构的处理器。

进一步地，可选的，上述存储器可以包括只读存储器和随机访问存储器。该存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以包括只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以包括随机访问存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM均可用。例如，静态随机访问存储器(Static RAM，SRAM)、动态随机访问存储器(Dynamic Random Access Memory，DRAM)、同步动态随机访问存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机访问存储器(Double Data RateSDRAM，DDR SDRAM)、增强型同步动态随机访问存储器(Enhanced SDRAM，ESDRAM)、同步链接动态随机访问存储器(Sync link DRAM，SLDRAM)和直接内存总线随机访问存储器(DirectRambus RAM，DR RAM)。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生依照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中描述的或在此以其他方式描述的任何过程或方法可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能。

在流程图中描述的或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。

应理解的是，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器，磁盘或光盘等。

以上所述，仅为本申请的示例性实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请记载的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种机器学习模型的优化方法，其特征在于，所述方法包括：

获取机器学习模型的配置文件和训练样本数据；所述配置文件包括所述机器学习模型的样本特征配置文件和模型配置文件；

基于所述配置文件，确定所述机器学习模型、所述机器学习模型的训练样本特征和所述机器学习模型的运行环境；

在所述运行环境中，利用所述训练样本特征训练所述机器学习模型，得到所述机器学习模型的训练结果相关数据；

将所述结果相关数据提供给用户，以用于为所述机器学习模型的优化提供参考。

2.根据权利要求1所述的方法，其特征在于，基于所述配置文件，确定所述机器学习模型的训练样本特征，包括：

从所述样本特征配置文件中获取样本特征生成规则，基于所述样本特征生成规则和所述训练样本数据，确定所述训练样本特征。

3.根据权利要求1或2所述的方法，其特征在于，基于所述配置文件，确定所述机器学习模型和所述机器学习模型的运行环境，包括：

从所述模型配置文件中获取所述机器学习模型的超参数和运行环境相关信息；

根据所述超参数确定所述机器学习模型，根据所述运行环境相关信息，确定所述机器学习模型的运行环境。

4.根据权利要求3所述的方法，其特征在于，所述从所述模型配置文件中获取所述机器学习模型的超参数和运行环境相关信息，包括：

从所述模型配置文件中获取所述机器学习模型的多组超参数和所述多组超参数分别对应的运行环境相关信息；

所述根据所述超参数确定所述机器学习模型，根据所述运行环境相关信息，确定所述机器学习模型的运行环境，包括：

根据所述多组超参数确定多个机器学习模型，根据所述多组超参数分别对应的运行环境相关信息，确定所述多个机器学习模型分别对应的运行环境，所述运行环境用于隔离所述多个机器学习模型。

5.根据权利要求1所述的方法，其特征在于，所述获取机器学习模型的配置文件和训练样本数据，包括：

按照预设时间周期获取所述配置文件和源日志数据，确定所述配置文件和所述源日志数据已更新；

对所述源日志数据进行预处理，得到所述训练样本数据。

6.根据权利要求1所述的方法，其特征在于，所述配置文件还包括模板配置文件；所述方法还包括：

从所述模板配置文件中获取所述训练样本数据的数据版本信息；所述结果相关数据包括所述数据版本信息。

7.根据权利要求1所述的方法，其特征在于，所述将所述结果相关数据提供给用户，包括：

将所述结果相关数据发送至监测服务器，所述监测服务器通过用户终端展示所述结果相关数据；所述结果相关数据包括所述机器学习模型的超参数和训练结果指标。

8.一种机器学习模型的优化装置，其特征在于，所述装置包括：

获取模块，用于获取机器学习模型的配置文件和训练样本数据；所述配置文件包括所述机器学习模型的样本特征配置文件和模型配置文件；

确定模块，用于基于所述配置文件，确定所述机器学习模型、所述机器学习模型的训练样本特征和所述机器学习模型的运行环境；

训练模块，用于在所述运行环境中，利用所述训练样本特征训练所述机器学习模型，得到所述机器学习模型的训练结果相关数据；

提供模块，用于将所述结果相关数据提供给用户，以用于为所述机器学习模型的优化提供参考。

9.一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器在执行所述计算机程序时实现权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。