CN116432776A - 目标模型的训练方法、装置、设备及存储介质 - Google Patents
目标模型的训练方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116432776A CN116432776A CN202310411500.3A CN202310411500A CN116432776A CN 116432776 A CN116432776 A CN 116432776A CN 202310411500 A CN202310411500 A CN 202310411500A CN 116432776 A CN116432776 A CN 116432776A
- Authority
- CN
- China
- Prior art keywords
- target model
- data
- training
- index
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 238000010276 construction Methods 0.000 claims abstract description 46
- 238000000605 extraction Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000011156 evaluation Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 14
- 238000013075 data extraction Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 abstract description 11
- 238000003672 processing method Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 17
- 238000013145 classification model Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000007689 inspection Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012847 principal component analysis method Methods 0.000 description 2
- 230000003245 working effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种目标模型的训练方法、装置、设备及计算机可读存储介质,该方法包括:获取目标模型的指标统计数据;根据指标统计数据确定目标模型是否处于待更新状态;若目标模型处于待更新状态,获取目标模型的历史运行数据;基于预设的特征构建规则,对历史运行数据进行特征提取处理,得到历史运行数据对应的特征数据;根据特征数据对目标模型进行训练,得到训练好的目标模型。本申请能够使得机器学习模型实现自动化机器学习,无需人工进行处理,降低人力成本,以及提升了机器学习模型的便利性及效率。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种目标模型的训练方法、装置、设备及计算机可读存储介质。
背景技术
随着移动互联网技术的普及和人工智能技术的发展,机器学习模型广泛应用在商业生产活动中,如分类模型用于对实时数据进行自动化分类,以提高分类效率。机器学习强依赖于训练样本的数据质量,即样本数据与预测数据的分布情况,样本数据越接近预测数据,机器学习模型的预测性能越强。
当训练模型部署于生产系统后,如果生产数据的分布发生了变化,与模型的训练数据存在偏离,则模型的预测精度将下降。如信用评分分类模型,待预测的用户群体与训练样本代表的用户群体存在较大偏移,则模型预测的分类结果质量较差。当前业界常见的解决方案为使用新的生产数据进行模型训练和模型更新。但目前的解决方案,需要耗费的人力较多,以及,从发现机器学习模型的预测结果异常到完成机器学习模型的训练以及到完成部署的流程较长,时效性较差,对线上业务的正常运行产生较大影响。
发明内容
本申请提供一种目标模型的训练方法、装置、设备及计算机可读存储介质,旨在降低模型训练的需要的人力成本,提高模型训练的便利性及效率。
第一方面,本申请提供一种目标模型的训练方法,所述目标模型的训练方法包括以下步骤:
获取目标模型的指标统计数据;
根据所述指标统计数据确定所述目标模型是否处于待更新状态;
若所述目标模型处于待更新状态,获取所述目标模型的历史运行数据;
基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据;
根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型。
第二方面,本申请还提供一种目标模型的训练装置,所述目标模型的训练装置包括:
第一数据获取装置,用于获取目标模型的指标统计数据;
状态确定装置,用于根据所述指标统计数据确定所述目标模型是否处于待更新状态;
第二数据获取装置,用于若所述目标模型处于待更新状态,获取所述目标模型的历史运行数据;
特征数据提取装置,用于基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据;
模型训练装置,用于根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的目标模型的训练方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的目标模型的训练方法的步骤。
本申请提供一种目标模型的训练方法、装置、设备及计算机可读存储介质,本申请通过获取目标模型的指标统计数据;根据所述指标统计数据确定所述目标模型是否处于待更新状态;若所述目标模型处于待更新状态,获取所述目标模型的历史运行数据;基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据;根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型,能够通过目标模型的指标统计数据确定目标模型是否需要进行更新,并且在目标模型需要更新时,能够利用历史运行数据进行更新,无需人工进行处理,降低人力成本,并且能够及时对模型进行训练更新,从而提升模型训练的便利性及效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的目标模型的训练方法的步骤流程示意图;
图2为本申请一实施例提供的目标模型的训练方法的流程示意图;
图3为本申请一实施例提供的目标模型的训练装置的示意性框图;
图4为本申请一实施例涉及的计算机设备的结构示意框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种目标模型的训练方法、装置、计算机设备及计算机可读存储介质。其中,该目标模型的训练方法可应用于终端设备中,该终端设备可以是平板电脑、笔记本电脑、台式电脑等电子设备。也可以应用于服务器中,该服务器可以是单独的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1、图2,图1为本申请的一实施例提供的目标模型的训练方法的步骤流程示意图,图2为本申请一实施例提供的目标模型的训练方法的流程示意图。
如图1所示,该目标模型的训练方法包括步骤S101至步骤S105。
步骤S101、获取目标模型的指标统计数据。
示例性的,指标统计数据用于指示对目标模型的生产数据对应的指标统计结果,例如,目标模型为分类模型,则分类模型的指标统计数据包括准确率、精确率、召回率、AUC(Area Under Curve)值等;其中,在具体的文档关键词检索的实施方式中,分类模型的召回率能够根据检索出的包含关键词的文档数与参与检索的总文档数确定。又例如,目标模型为回归模型,则回归模型的指标统计数据包括均方误差(MSE),均方根误差(RMSE)等。
可选的,分类模型包括逻辑回归模型、决策树模型、支持向量机模型、朴素贝叶斯模型或其他分类模型。回归模型包括线性回归(Linear Regression)模型、逻辑回归(Logistic Regression)模型、多项式回归(Polynomial Regression)模型、逐步回归(Stepwise Regression)模型、弹性回归(ElasticNet Regression)模型等。
需要说明的是,以上描述并不对本申请的目标模型及目标模型对应的指标统计数据予以限定。
示例性的,通过确定目标模型,以及基于映射关系库确定目标模型对应的效果指标,以获取目标模型对应的指标统计数据。从而能够根据目标模型对应的指标统计数据确定目标模型是否需要进行更新,以实现自动化的机器学习。
示例性的,将获取的指标统计数据输入至目标数据库中进行存储,以在目标数据库中实现指标统计数据的监测及分析,从而能够根据分析结果评价目标模型的效果质量,例如评价分类模型是否出现误分类、未分类等情况。
在具体的实施过程中,利用目标数据库对指标统计数据实现展示,使得用户能够查看指标统计数据。
步骤S102、根据所述指标统计数据确定所述目标模型是否处于待更新状态。
示例性的,根据获取到的指标统计数据确定目标模型是否需要进行更新,若确定目标模型需要进行更新,则对目标模型进行训练更新。
可以理解的,在目标模型的效果不佳,例如预测模型的预测效果较差、分类模型的分类效果较差时,需要及时对预测模型和/或分类模型进行训练更新,从而提高预测模型的预测准确性和/或提高分类模型的分类准确性,提高用户使用体验感。具体的,通过指标统计数据确定目标模型的效果。
在具体实施过程中,根据存储于目标数据库中的指标统计数据确定目标模型是否需要进行更新。
在一些实施例中,根据指标统计数据确定目标模型是否处于待更新状态,包括:根据指数统计数据与预设指标统计数据阈值确定目标模型是否处于待更新状态。
示例性的,通过指标统计数据与预设指标统计数据阈值确定目标模型是否需要更新,可以理解的,预设指标统计数据阈值由对应的维护人员设定的固定值,以根据指标统计数据与预设指标数据阈值确定目标模型的工作效果,例如预测模型的预测效果。
可以理解的,通过上述方式确定固定的指标统计数据阈值,从而通过指标统计数据与单侧标准固定值确定目标模型是否需要更新。
在一些实施方式中,预设指标统计数据阈值根据目标模型的历史指标统计数值确定。例如,根据指标统计数据确定预设时长内的指标统计数值,根据预设时长内的指标统计数值确定预设时长内指标统计数值的均值及标准差,并根据预设时长内指标统计数值的均值及标准差确定预设指标统计数据阈值。可选的,确定当前日期至历史第7天内的指标统计数值,根据当前日期至历史第7天内的指标统计数值确定该7天内指标统计数值的均值及标准差,从而确定指标统计数据阈值。
可以理解的,通过上述确定浮动的标统计数据阈值,从而通过指标统计数据与单侧标准浮动值确定目标模型是否需要更新。
在另一些实施例中,根据指标统计数据与第一数值阈值以及第二数值阈值确定目标模型是否处于待更新状态,其中,第一数值阈值小于第二数值阈值。
示例性的,指标统计数据同时与第一数值阈值以及第二数值阈值比较,以通过指标统计数据与双侧标准阈值确定目标模型是否处于待更新状态。
在一些实施例中,所述预设指标统计数据阈值包括预设第一数值阈值和预设第二数值阈值,所述根据所述指标统计数据与预设指标统计数据阈值确定所述目标模型是否处于待更新状态包括:若所述指标统计数据大于所述预设第一数值阈值,或所述指标统计数据小于所述预设第二数值阈值,确定所述目标模型处于待更新状态。
可以理解的,在指标统计数据大于第一数值阈值或小于第二数值阈值时,确定目标模型需要更新。例如,第一数值阈值为50,第二数值阈值为100,在根据指标统计数据确定的指标统计数值小于50或大于100时,确定目标模型需要更新,以实现利用双侧标准阈值对目标模型是否需要更新的判断。
在一些实施例中,方法还包括:根据指标统计数据确定预设时长内的指标统计数值;根据预设时长内的指标统计数值确定预设时长内的指标统计数值均值及预设时长内的指标统计数值标准差;根据预设时长内的标准统计数值均值及预设时长内的指数统计数值标准差确定第一数值阈值及第二数值阈值。
示例性的,可以在指标统计数据确定预设时长内的指标统计数值,例如确定当前日期至历史7天的指标统计数值,并根据该7天内的指标统计数值确定均值及标准差,以及根据确定的均值及标准差确定第一数值阈值及第二数值阈值。
示例性的,根据均值、标准差及预设系数确定第一数值阈值及第二数值阈值。
在具体的实施过程中,计算预设系数与标准差的乘积,将均值减去得到的乘积,得到第一数值阈值;计算预设系数与标准差的乘积,将均值加上得到的乘积,得到第二数值阈值。
例如,预设系数为1.96,均值为50,标准差为10,则第一数值阈值与第二数值阈值的计算过程如下:
第一数值阈值:50-10×1.96=31.4
第二数值阈值:50+10×1.96=69.6
示例性的,根据上述计算过程确定的第一数值阈值及第二数值阈值,以及目标模型的指标统计数据,确定目标模型的工作效果是否符合预期,从而确定目标模型是否需要更新。
步骤S103、若所述目标模型处于待更新状态,获取所述目标模型的历史运行数据。
示例性的,若目标模型处于待更新状态,能够获取目标模型的历史运行数据以及根据获取的历史运行数据对目标模型进行训练,从而减少模型实际运行过程中的数据与训练数据的偏移量,以提升机器学习模型的性能。
示例性的,目标模型的历史运行数据可以是目标模型的历史输入数据及历史输出数据,从而使得训练数据与实际运行过程中的数据贴合。
可以理解的,若目标模型处于正常状态,也即无需对目标模型更新,则重复上述步骤S101至步骤S102,实现对目标模型的监控,直至目标模型处于待更新状态时,执行步骤S103及之后的步骤。
步骤S104、基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据。
示例性的,历史运行数据为目标模型历史运行时间内被记录的数据,从而能够根据历史运行数据对目标模型进行训练更新。例如,在目标模型为信用评分分类模型时,历史运行数据包括历史时间内输入的用户数据及与输入的用户数据对应的评分数据。
示例性的,利用预设的特征构建规则,对历史运行数据进行特征提取处理,从而得到特征数据,可以理解的,利用特征数据对目标模型进行训练能够提升训练效率及减少了训练数据与实际使用的数据的偏移量。
在一些实施例中,基于预设的特征构建规则,对历史运行数据进行特征提取处理,得到历史运行数据对应的特征数据,包括:从特征构建方法数据库中确定目标特征构建方法;基于目标特征构建方法,对历史运行数据进行特征提取处理,得到历史运行数据对应的特征数据。
示例性的,特征构建方法包括主成分分析法,通过主成分分析法,从历史运行数据中提取特征数据,可以理解的,特征数据能够代表80%的历史运行数据,以在利用特征数据进行目标模型的训练更新中,提升训练效率以及训练的准确性。
需要说明的是,本申请不对特征构建方法予以限定,本领域技术人员还可利用其它特征构建方法对历史运行数据进行特征提取。
在一些实施例中,在从特征构建方法数据库中确定目标特征构建方法之后,还包括:确定目标特征构建方法对应的特征数据检验条件;基于目标特征构建方法,对历史运行数据进行特征提取处理,得到历史运行数据对应的特征数据,包括:基于目标特征构建方法,对历史运行数据进行特征提取,得到待处理特征数据;确定待处理特征数据是否符合特征数据检验条件;将符合特征数据检验条件的待处理特征数据确定为特征数据。
示例性的,在确定目标特征构建方法后,确定目标特征构建方法对应的特征数据检验条件,例如目标特征构建方法为主成分分析法,对应的特征数据检验条件则是确定特征数据包含的信息特征是否大于或等于80%,以确定提取得到特征数据是否符合使用条件。
在具体的实施例中,确定待处理特征数据是否符合特征数据检验条件,例如通过阈值比较、信息特征分析确定待处理特征数据是否符合特征数据检验条件,以将符合特征数据检验条件的待处理特征数据确定为特征数据。
通过利用历史运行数据提取特征数据,并对特征数据进行检验,能够提升特征数据的准确性,同时,利用历史运行数据对应的特征数据进行训练,能够减少由于生产数据、使用数据分布变化对模型造成的影响。
步骤S105、根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型。
示例性的,将特征数据输入至目标模型中,并根据目标模型输出的数据及特征数据进行参数调整处理,得到训练好的目标模型。
可以理解的,得到训练好的目标模型后,对训练好的目标模型后进行部署,例如上线目标模型,以使得能够基于训练好的目标模型进行数据的预测、分类等处理。
示例性的,预先设定若干参数调整算法,以使得在训练过程中,能够根据特征数据及对应的输出数据确定参数调整算法,并基于参数调整算法调整目标模型的参数,得到训练好的目标模型。其中,参数调整算法包括Grid_search网格搜索最优参数、随机搜索、梯度下降等算法。
在一些实施例中,根据特征数据对目标模型进行训练,得到训练好的目标模型,包括:根据特征数据对目标模型进行多次训练,得到各次训练后对应的目标模型;确定各次训练后得到的目标模型的评价指标数值;根据评价指标数值及预设评价指标条件,从各次训练后得到的目标模型中确定训练好的目标模型。
示例性的,在利用历史运行数据提取特征数据的过程中,可以根据不同时间段的历史运行数据得到各个历史时间段对应的特征数据,以在对目标模型训练过程中,能够利用每一个历史时间段对应的特征数据对目标模型进行训练,从而得到每一次训练后的目标模型。
确定每一次训练后的目标模型对应的评价指标数值,以利用评价指标数值及预设评价指标条件,从每一次训练后对应的目标模型中确定训练好的目标模型。
在具体的实施过程中,以目标模型为回归模型为例说明:利用十组特征数据对回归模型进行训练,得到十个训练后的回归模型。确定每一个回归模型的评价指标数值,例如MSE数值,并根据每个回归模型的MSE数值,对十个回归模型进行排序处理,从而在预设评价指标条件包括MSE阈值时,将MSE数值小于MSE阈值的回归模型作为训练好的回归模型;或在预设评价指标条件包括根据排序结果确定时,将位于目标位置之前的回归模型作为训练好的回归模型,目标位置为排序第三的位置,多个回归模型按照各自对应的MSE值有小到大排序。
需要说明的是,上述确定训练好的目标模型为示例性说明,并不对本申请确定训练好的目标模型的具体模型类型及方式予以限定。
上述实施例提供的目标模型的训练方法,通过获取目标模型的指标统计数据;根据指标统计数据确定目标模型是否处于待更新状态;若目标模型处于待更新状态,获取目标模型的历史运行数据;基于预设的特征构建规则,对历史运行数据进行特征提取处理,得到历史运行数据对应的特征数据;根据特征数据对目标模型进行训练,得到训练好的目标模型,能够实现目标模型的自动训练更新,减少人力成本,同时减少传统建模中受限于算法员工水平的影响,以及缩减了发现模型使用效果下降的时间,从而提高了模型更新的效率,并且利用历史运行数据进行训练,减少由于生产数据或实际使用数据与训练数据分布变化造成的影响。
请参阅图3,图3是本申请一实施例提供的目标模型的训练装置的示意图,该目标模型的训练装置可以配置于服务器或终端中,用于执行前述的目标模型的训练方法。
如图3所示,该目标模型的训练装置,包括:第一数据获取模块110、状态确定模块120、第二数据获取模块130、特征数据提取模块140、模型训练模块150。
第一数据获取模块110,用于获取目标模型的指标统计数据。
状态确定模块120,用于根据指标统计数据确定目标模型是否处于待更新状态。
第二数据获取模块130,用于若目标模型处于待更新状态,获取目标模型的历史运行数据。
特征数据提取模块140,用于基于预设的特征构建规则,对历史运行数据进行特征提取处理,得到历史运行数据对应的特征数据。
模型训练模块150,用于根据特征数据对目标模型进行训练,得到训练好的目标模型。
示例性的,特征数据提取模块140包括特征构建方法确定子模块。
特征构建方法确定子模块,用于从特征构建方法数据库中确定目标特征构建方法。
特征数据提取模块140,还用于基于目标特征构建方法,对历史运行数据进行特征提取处理,得到历史运行数据对应的特征数据。
示例性地,目标模型的训练装置还包括检验条件确定模块。
检验条件确定模块,用于确定目标特征构建方法对应的特征数据检验条件。
特征数据提取模块140还包括待处理特征数据获取子模块、数据检验子模块;特征数据确定子模块。
待处理特征数据获取子模块,用于基于目标特征构建方法,对历史运行数据进行特征提取,得到待处理特征数据。
数据检验子模块,用于确定待处理特征数据是否符合特征数据检验条件。
特征数据确定子模块,用于将符合特征数据检验条件的待处理特征数据确定为特征数据。
示例性地,状态确定模块120还用于根据指标统计数据与预设指标统计数据阈值确定目标模型是否处于待更新状态;或者根据指标统计数据与第一数值阈值以及第二数值阈值确定目标模型是否处于待更新状态,其中,第一数值阈值小于第二数值阈值。
示例性的,目标模型的训练装置还包括指标统计数值确定模块、均值、标准差确定模块、数值阈值确定模块。
指标统计数值确定模块,用于根据指标统计数据确定预设时长内的指标统计数值。
均值、标准差确定模块,用于根据预设时长内的指标统计数值确定预设时长内的指标统计数值均值及预设时长内的指数统计数值标准差。
数值阈值确定模块,用于根据预设时长内的指标统计数值均值及预设时长内的指数统计数值标准差确定第一数值阈值及第二数值阈值。
示例性的,状态确定模块120还用于若指标统计数据大于预设指标统计数据阈值,确定目标模型处于待更新状态;或若指标统计数据大于第一数值阈值,或指标统计数据小于第二数值阈值,确定目标模型处于待更新状态。
示例性的,模型训练模块150包括评价指标数值确定子模块、模型确定子模块。
模型训练模块150还用于根据特征数据对目标模型进行多次训练,得到各次训练后对应的目标模型。
评价指标数值确定子模块,用于确定各次训练后得到的目标模型的评价指标数值。
模型确定子模块,用于根据评价指标数值及预设评价指标条件,从各次训练后得到的目标模型中确定训练好的目标模型。
请参阅图4,图4为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端。
如图4所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括存储介质和内存储器。
存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种目标模型的训练方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种目标模型的训练方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取目标模型的指标统计数据;
根据所述指标统计数据确定所述目标模型是否处于待更新状态;
若所述目标模型处于待更新状态,获取所述目标模型的历史运行数据;
基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据;
根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型。
在一个实施例中,所述处理器在实现基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据时,用于实现:
从特征构建方法数据库中确定目标特征构建方法;
基于所述目标特征构建方法,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据。
在一个实施例中,所述处理器在实现目标模型的训练方法时,用于实现:
确定所述目标特征构建方法对应的特征数据检验条件;
所述处理器在实现基于所述目标特征构建方法,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据时,用于实现:
基于所述目标特征构建方法,对所述历史运行数据进行特征提取,得到待处理特征数据;
确定所述待处理特征数据是否符合所述特征数据检验条件;
将符合所述特征数据检验条件的待处理特征数据确定为所述特征数据。
在一个实施例中,所述处理器在实现根据所述指标统计数据确定所述目标模型是否处于待更新状态时,用于实现:
根据所述指标统计数据与预设指标统计数据阈值确定所述目标模型是否处于待更新状态;或者
根据所述指标统计数据与第一数值阈值以及第二数值阈值确定所述目标模型是否处于待更新状态,其中,所述第一数值阈值小于所述第二数值阈值。
在一个实施例中,所述处理器在实现目标模型的训练方法时,用于实现:
根据所述指标统计数据确定预设时长内的指标统计数值;
根据所述预设时长内的指标统计数值确定所述预设时长内的指标统计数值均值及所述预设时长内的指数统计数值标准差;
根据所述预设时长内的指标统计数值均值及所述预设时长内的指数统计数值标准差确定所述第一数值阈值及所述第二数值阈值。
在一个实施例中,所述处理器在实现根据所述指标统计数据与预设指标统计数据阈值确定所述目标模型是否处于待更新状态时,用于实现:
若所述指标统计数据大于所述预设指标统计数据阈值,确定所述目标模型处于待更新状态;或
在预设指标统计数据阈值包括预设第一数值阈值和预设第二数值阈值的情况下,所述处理器在实现根据所述指标统计数据与预设指标统计数据阈值确定所述目标模型是否处于待更新状态时,用于实现:
若所述指标统计数据大于所述第一数值阈值,或所述指标统计数据小于所述第二数值阈值,确定所述目标模型处于待更新状态。
在一个实施例中,所述处理器在实现根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型时,用于实现:
根据所述特征数据对所述目标模型进行多次训练,得到各次训练后对应的目标模型;
确定各次训练后得到的目标模型的评价指标数值;
根据评价指标数值及预设评价指标条件,从各次训练后得到的目标模型中确定训练好的目标模型。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述目标模型的训练的具体工作过程,可以参考前述目标模型的训练控制方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请目标模型的训练方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种目标模型的训练方法,其特征在于,包括:
获取目标模型的指标统计数据;
根据所述指标统计数据确定所述目标模型是否处于待更新状态;
若所述目标模型处于待更新状态,获取所述目标模型的历史运行数据;
基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据;
根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型。
2.如权利要求1所述的目标模型的训练方法,其特征在于,所述基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据,包括:
从特征构建方法数据库中确定目标特征构建方法;
基于所述目标特征构建方法,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据。
3.如权利要求2所述的目标模型的训练方法,其特征在于,在从特征构建方法数据库中确定目标特征构建方法之后,还包括:
确定所述目标特征构建方法对应的特征数据检验条件;
所述基于所述目标特征构建方法,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据,包括:
基于所述目标特征构建方法,对所述历史运行数据进行特征提取,得到待处理特征数据;
确定所述待处理特征数据是否符合所述特征数据检验条件;
将符合所述特征数据检验条件的待处理特征数据确定为所述特征数据。
4.如权利要求1-3任一项所述的目标模型的训练方法,其特征在于,所述根据所述指标统计数据确定所述目标模型是否处于待更新状态,包括:
根据所述指标统计数据与预设指标统计数据阈值确定所述目标模型是否处于待更新状态;或者
根据所述指标统计数据与第一数值阈值以及第二数值阈值确定所述目标模型是否处于待更新状态,其中,所述第一数值阈值小于所述第二数值阈值。
5.如权利要求4所述的目标模型的训练方法,其特征在于,所述方法还包括:
根据所述指标统计数据确定预设时长内的指标统计数值;
根据所述预设时长内的指标统计数值确定所述预设时长内的指标统计数值均值及所述预设时长内的指数统计数值标准差;
根据所述预设时长内的指标统计数值均值及所述预设时长内的指数统计数值标准差确定所述第一数值阈值及所述第二数值阈值。
6.如权利要求4所述的目标模型的训练方法,其特征在于,所述根据所述指标统计数据与预设指标统计数据阈值确定所述目标模型是否处于待更新状态包括:
若所述指标统计数据大于所述预设指标统计数据阈值,确定所述目标模型处于待更新状态;或
所述预设指标统计数据阈值包括预设第一数值阈值和预设第二数值阈值,所述根据所述指标统计数据与预设指标统计数据阈值确定所述目标模型是否处于待更新状态包括:
若所述指标统计数据大于所述第一数值阈值,或所述指标统计数据小于所述第二数值阈值,确定所述目标模型处于待更新状态。
7.如权利要求1-3任一项所述的目标模型的训练方法,其特征在于,所述根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型,包括:
根据所述特征数据对所述目标模型进行多次训练,得到各次训练后对应的目标模型;
确定各次训练后得到的目标模型的评价指标数值;
根据评价指标数值及预设评价指标条件,从各次训练后得到的目标模型中确定训练好的目标模型。
8.一种目标模型的训练装置,其特征在于,所述目标模型的训练装置包括:
第一数据获取模块,用于获取目标模型的指标统计数据;
状态确定模块,用于根据所述指标统计数据确定所述目标模型是否处于待更新状态;
第二数据获取模块,用于若所述目标模型处于待更新状态,获取所述目标模型的历史运行数据;
特征数据提取模块,用于基于预设的特征构建规则,对所述历史运行数据进行特征提取处理,得到所述历史运行数据对应的特征数据;
模型训练模块,用于根据所述特征数据对所述目标模型进行训练,得到训练好的目标模型。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的目标模型的训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的目标模型的训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310411500.3A CN116432776A (zh) | 2023-04-06 | 2023-04-06 | 目标模型的训练方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310411500.3A CN116432776A (zh) | 2023-04-06 | 2023-04-06 | 目标模型的训练方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116432776A true CN116432776A (zh) | 2023-07-14 |
Family
ID=87092339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310411500.3A Pending CN116432776A (zh) | 2023-04-06 | 2023-04-06 | 目标模型的训练方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116432776A (zh) |
-
2023
- 2023-04-06 CN CN202310411500.3A patent/CN116432776A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190294975A1 (en) | Predicting using digital twins | |
US20180322411A1 (en) | Automatic evaluation and validation of text mining algorithms | |
CN113626241B (zh) | 应用程序的异常处理方法、装置、设备及存储介质 | |
CN108681751B (zh) | 确定事件影响因素的方法及终端设备 | |
CN111625516A (zh) | 检测数据状态的方法、装置、计算机设备和存储介质 | |
CN108470071B (zh) | 一种数据处理方法及装置 | |
CN111797320B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN114817425B (zh) | 一种冷热数据分类的方法、装置、设备及可读存储介质 | |
CN111814056A (zh) | 基于信息处理的供应商推荐方法及相关设备 | |
CN111582488A (zh) | 一种事件推演方法及装置 | |
CN111159481B (zh) | 图数据的边预测方法、装置及终端设备 | |
CN114565196B (zh) | 基于政务热线的多事件趋势预判方法、装置、设备及介质 | |
CN116915710A (zh) | 流量预警方法、装置、设备及可读存储介质 | |
CN110334262B (zh) | 一种模型训练方法、装置及电子设备 | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN112231299A (zh) | 一种特征库动态调整的方法和装置 | |
CN112131274A (zh) | 时间序列异常点的检测方法、装置、设备及可读存储介质 | |
CN111783883A (zh) | 一种异常数据的检测方法及装置 | |
CN110705889A (zh) | 一种企业筛选方法、装置、设备及存储介质 | |
CN116342164A (zh) | 目标用户群体的定位方法、装置、电子设备及存储介质 | |
CN116432776A (zh) | 目标模型的训练方法、装置、设备及存储介质 | |
CN113837807A (zh) | 热度预测方法、装置、电子设备及可读存储介质 | |
CN111737554A (zh) | 评分模型训练方法、电子书评分方法及装置 | |
CN117132177B (zh) | 基于多重假设检验的径流预报模型构建和径流预报方法 | |
CN117132176B (zh) | 基于预报因子筛选的径流预报模型构建和径流预报方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |