CN110796270A - 一种机器学习模型选择方法 - Google Patents

一种机器学习模型选择方法 Download PDF

Info

Publication number
CN110796270A
CN110796270A CN201911034545.3A CN201911034545A CN110796270A CN 110796270 A CN110796270 A CN 110796270A CN 201911034545 A CN201911034545 A CN 201911034545A CN 110796270 A CN110796270 A CN 110796270A
Authority
CN
China
Prior art keywords
model
test
performance
algorithm
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911034545.3A
Other languages
English (en)
Inventor
杨忠勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianshu Technology Co ltd
Original Assignee
Shenzhen Supercomputer Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Supercomputer Technology Development Co Ltd filed Critical Shenzhen Supercomputer Technology Development Co Ltd
Priority to CN201911034545.3A priority Critical patent/CN110796270A/zh
Publication of CN110796270A publication Critical patent/CN110796270A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种机器学习模型选择方法,主要包括模型设置、训练测试、模型评估、模型选择、预测推理、模型监控,通过模型选择策略和模型评估结果选出采用的算法模型,模型选择过程分解为资源消耗、性能、业务风险等多个方面,更广泛的覆盖了机器学习模型选择所涉及的必要和关键过程,可以适用于各种类型机器学习算法模型的选择,通用性高。同时采用资源消耗、性能、业务风险等多个维度来作为模型选择的依据,除了使用常规的模型性能,还将工程代价和业务风险引入到模型选择过程,有效保证了算法模型的高工程可用性和低应用风险,实用价值高。

Description

一种机器学习模型选择方法
技术领域
本发明涉及计算机技术领域,特别涉及一种机器学习模型选择方法。
背景技术
机器学习是一项影响广泛的技术,它利用智能算法和计算机系统自动提取数据中的价值信息,显著提升系统的决策效率、准确率、实时性等性能。目前机器学习技术广泛应用于社会生产生活的多个方面,例如监控安防、语音助手、医疗诊断、产品质量检测等,带来生产、生活方式的变革。
机器学习包括数据、算法和算力三个要素,机器学习拥有丰富的算法模型,比如逻辑回归模型(Logistics Regression)、支持向量机模型(SVM)、神经网络模型(NeuralNetwork)、决策树(Decision Tree)等,这些算法本质是将数据模型化,并利用训练数据来寻找最优的模型参数,以便准确的表达数据和处理数据。在实际应用中需要选择合适的算法模型,然而,由于不同的机器学习模型可能存在相似的功能或性能,为机器学习的算法模型选择与应用带来了一定的困难。
模型选择通常建立在算法本身性能基础上,比如召回率(Recall)、准确率(Precision)等,但是,这种方式可能忽略了工程和业务等对模型的约束因素,比如计算和存储资源代价、业务风险代价等,可能导致选出的模型存在应用缺陷。
发明内容
本发明提出一种机器学习模型选择方法,旨在实现从算法、工程和业务多维度选择机器学习模型的方法,使其适用于多种目标任务的机器学习算法模型选择。
为实现上述目的,本发明提出的机器学习模型选择方法,包括如下步骤:
步骤S1:模型设置,根据目标任务确定多个候选算法模型的类型,每种类型可包含多个子模型。算法模型记为hk(x),设置各算法模型的功能参数,并初始化待训练算法模型hk(x)的性能参数记为θk;K为候选算法模型hk(x)的总个数;
步骤S2:训练测试,包括模型训练和模型测试,利用训练数据集训练算法模型hk(x)找出影响算法性能的最优性能参数,得出模型训练性能和训练资源消耗数据序列,训练数据集样本总个数记为M;再利用测试数据集评估该算法模型hk(x)的泛化能力,得到的模型泛化能力性能指标分别记为:pk 1,pk 2,…,并得出模型测试的资源消耗数据序列,测试数据集样本总个数记为N;
步骤S3:模型评估,包括资源评估、性能评估、业务评估,根据模型训练和模型测试的资源消耗数据序列,得到资源评估结果,根据模型测试的若干性能指标,得到综合性能评估结果,根据算法模型hk(x)的测试集预测推理结果和业务风险函数评估算法模型hk(x),得到总体业务风险;
步骤S4:模型选择,预先定义模型选择决策,根据模型选择策略和模型评估结果选出采用的算法模型hk(x);
步骤S5:预测推理,将选出的算法模型hk(x)用于实际业务数据的预测推理,并将预测推理结果送入模型监控;
步骤S6:模型监控,通过模型监控实时分析预测结果,并监控异常结果,以便算法模型hk(x)迭代优化。
优选地,所述步骤S2中模型训练包括如下步骤:
a.将训练数据集记为:
dtrain=﹛(x(1),y(1)),x(2),y(2)),…(x(M),y(M))﹜
其中,
x(m)为第m个训练样本的输入数据;
y(m)为第m个训练样本的目标输出数据;
m=1,2,…M;M为训练数据集样本总个数。
b.对于每个候选算法模型hk(x),先计算算法模型hk(x)的最优性能参数,定义算法模型hk(x)目标函数为:
Objectivek=Cost(dtrain,hk(x))
通过迭代优化算法求出使Objectivek最小化的参数θk,即为最优性能参数;
c.通过dtrain、hk(x)、最优性能参数计算出表征训练质量好坏的性能指标;
d.统计训练过程中的计算资源消耗、存储资源消耗等信息:
﹛ctrain,k,mtrain,k
可以采用周期采样的方式统计计算资源、存储资源,得出模型训练的资源消耗数据序列;
所述步骤S2中模型测试包括如下步骤:
a.将测试数据集记为:
dtest=﹛(xtest (1),ytest (1)),xtest (2),ytest (2)),…(xtest (N),ytest (N))﹜
其中:
xtest (n)为第n个测试样本的输入数据;
ytest (n)为第n个测试样本的目标输出数据;
n=1,2,…N,N为测试数据集样本总个数。
b.对于每个候选算法模型hk(x),先计算预测推理结果,并得到模型测试的性能:
﹛pk 1,pk 2,…,trk
其中:
pk 1,pk 2,…为模型测试的性能指标,与目标任务类型关联;
trk表示候选算法模型hk(x)对测试样本的预测推理结果序列,用于业务风险评估;
c.统计记录预测推理的资源消耗,包括统计模型推理时长、计算资源消耗、存储资源消耗:
﹛tinfer,k,cinfer,k,minfer,k
可采用周期采样的方式统计推理时长、计算资源、存储资源,得出模型测试的资源消耗数据序列。
优选地,所述步骤S3中模型评估包括资源评估、性能评估、业务评估;
a.资源评估
包括对模型训练和模型测试资源消耗的数据统计,统计内容如下:
由模型训练的资源消耗数据序列得到计算资源、存储资源的统计信息:
﹛ctrainr,k,stat,mtrainr,k,stat
ctrainr,k,stat或mtrainr,k,stat可以是均值、峰值、方差等统计特征的序列;
由模型测试的资源消耗数据序列得到推理时长、计算资源、存储资源的统计信息:
﹛tinfer,k,stat,cinfer,k,stat,minfer,k,stat
tinfer,k,stat或cinfer,k,stat或minfer,k,stat可以是均值、峰值、方差等统计特征的序列。
b.性能评估
由所述步骤S2中模型测试的性能指标pk 1,pk 2,…,计算模型测试的综合性能,记为testPerfk
testPerfk=f(pk 1,pk 2,…)
综合性能用于判断测试性能的好坏。
c.业务评估
先定义单个测试样本的业务风险函数,得出业务风险值rk (n)
rk (n)=g(ytest (n),trk (n))
其中:
trk (n)为算法模型hk(x)对第n个测试样本输入数据xtest (n)的预测推理结果,其目标结果为ytest (n)
再定义业务风险计算函数,得出总体业务风险,记为Riskk
Riskk=π(﹛rk (n),n=1,2,…,N﹜)
业务风险计算函数π需根据实际业务需求来定义。
优选地,所述步骤S4中模型选择决策包括资源消耗、性能和业务风险三个方面的子策略,
其中:
资源消耗子策略记为ResRule;
性能子策略记为Perf Rule;
业务风险子策略RiskRule;
模型选择策略SelectionRule;
则SelectionRule为:﹛ResRule,PerfRule,RiskRule﹜
根据SelectionRule挑出满足所有策略条件的算法模型子集,子集中可能包含零个、一个或多个算法模型。
若模型子集只有一个算法模型,选择该算法模型;
若模型子集有两个或两个以上的算法模型,则采用资源优先、性能优先、风险优先或综合评分的原则,选出最优算法模型。
优选地,所述资源优先为:选择计算资源或存储资源消耗最小的模型,对于选择资计算资源最小还是存储资源最小,需要根据实际系统设计需求确定。
所述风险优先为:选择业务风险最低的模型;或者,在计算资源允许的情况下,可以分析多模型联合能否获得更低的业务风险。
所述性能优先为:选择性能最优的模型;或者,在计算资源允许的情况下,可以分析多模型联合能否获得更好的性能。
所述综合评分为:将资源消耗、性能、业务风险进行评分并加权,得到综合评分,综合评分越高,选择优先级越高。
优选地,所述步骤S5中,将选定的算法模型hk(x)应用于实际业务,实际业务的输入数据记为xin,得到预测推理结果,记为ypredict
ypredict=hk(xin)
并将预测数据(xin,ypredict)送入模型监控。
优选地,所述步骤S6中所述模型监控为:
先定义异常或关注场景;
再统计预测推理结果的概率特征;
根据异常或关注场景要求,判断是否出现异常或关注场景,如果出现则及时反馈给模型设置单元,作为模型迭代优化的依据。
与现有技术相比,本发明的有益效果是:将模型选择的过程分解为资源消耗、性能、业务风险代价等多个方面,更广泛的覆盖了机器学习模型选择所涉及的必要和关键过程,可以适用于各种类型机器学习算法模型的选择,通用性高。
同时采用资源消耗、性能、业务代价等多个维度来作为模型选择的依据,除了使用常规的模型性能,还将工程代价和业务风险引入到模型选择过程,有效保证了算法模型的高工程可用性和低应用风险,实用价值高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明机器学习模型选择方法流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
本发明提出一种机器学习模型选择方法,包括如下步骤:
步骤S1:模型设置,根据目标任务确定多个候选算法模型的类型,每种类型可包含多个子模型,算法模型记为hk(x),设置各算法模型的功能参数,并初始化待训练算法模型hk(x)的性能参数记为θk;K为候选算法模型hk(x)的总个数;
步骤S2:训练测试,包括模型训练和模型测试,利用训练数据集训练算法模型hk(x)找出影响算法性能的最优性能参数,得出模型训练性能和训练资源消耗数据序列,训练数据集样本总个数记为M;再利用测试数据集评估该算法模型hk(x)的泛化能力,得到的模型泛化能力性能指标分别记为:pk 1,pk 2,…,并得出模型测试的资源消耗数据序列,测试数据集样本总个数记为N;
步骤S3:模型评估,包括资源评估、性能评估、业务评估,根据模型训练和模型测试的资源消耗数据序列,得到资源评估结果,根据模型测试的若干性能指标,得到综合性能评估结果,根据算法模型hk(x)的测试集预测推理结果和业务风险函数评估算法模型hk(x),得到总体业务风险;
步骤S4:模型选择,预先定义模型选择决策,根据模型选择策略和模型评估结果选出采用的算法模型hk(x);
步骤S5:预测推理,将选出的算法模型hk(x)用于实际业务数据的预测推理,并将预测推理结果送入模型监控;
步骤S6:模型监控,通过模型监控实时分析预测结果,并监控异常结果,以便算法模型hk(x)迭代优化。
本发明将模型选择的过程分解为资源消耗、性能、业务风险等多个方面,更广泛的覆盖了机器学习模型选择所涉及的必要和关键过程,可以适用于各种类型机器学习算法模型的选择,通用性高。同时采用资源消耗、性能、业务风险等多个维度来作为模型选择的依据,除了使用常规的模型性能,还将工程代价和业务风险引入到模型选择过程,有效保证了算法模型的高工程可用性和低应用风险,实用价值高。
本实施例中,假设机器学习模型的任务类型为目标识别,待识别的目标包含3种类型,分别记为C1,C2,C3,训练数据集的样本个数M为600000,测试数据集的样本个数N为400000;
模型训练中训练数据集为:
dtrain=﹛(x(1),y(1)),x(2),y(2)),…(x(600000),y(600000))﹜
其中:
x(m)为第m个训练样本的输入数据;
y(m)为第m个训练样本的目标输出数据;
m=1,2,3,…600000。
模型测试中测试数据集为:
dtest=﹛(xtest (1),ytest (1)),xtest (2),ytest (2)),…(xtest (400000),ytest (400000))﹜
其中:
xtest (n)为第n个测试样本的输入数据;
ytest (n)为第n个测试样本的目标输出数据;
n=1,2,3,…400000。
所述步骤S1中,若涉及分类问题,可以选用逻辑回归、支持向量机、深度学习模型3种类型作为候选模型类型,并设置候选算法模型的功能参数:
(1)逻辑回归模型h1(x)的功能参数包括:特征、阶数等;
(2)支持向量机模型h2(x)的功能参数包括:线性核、特征等;
(3)第一深度神经网络h3(x)的功能参数包括:网络层数、每层神经元个数、激活函数类型等;
(4)第二深度神经网络h4(x)的功能参数包括:网络层数、每层神经元个数、激活函数类型等;
其中:第一深度神经网络h3(x)和第二深度神经网络h4(x)采用不同的层数和神经元数;
初始化每个机器学习算法模型待训练的性能参数为:θ1,θ2,θ3,θ4
所述步骤S2中,对于4个候选算法模型hk(x),分别执行如下步骤进行模型训练:
先计算算法模型hk(x)的最优性能参数,定义算法模型hk(x)的目标函数为:
Objectivek=Cost(dtrain,hk(x))
通过迭代优化算法求出使Objectivek最小化的性能参数θk,即为最优性能参数;
通过dtrain、hk(x)、最优性能参数计算出表征训练质量好坏的性能指标,如训练误差等;
利用计算机软件统计出训练过程中的计算资源消耗、存储资源消耗等信息:
﹛ctrain,k,mtrain,k
可以采用周期采样的方式统计计算资源、存储资源,得出模型训练的资源消耗数据序列。本实施例中,按照固定的时间间隔统计计算资源消耗和存储资源消耗,这里固定的时间间隔设置为0.1秒,计算资源消耗为CPU负载率,存储资源消耗为内存占用大小,即统计出每0.1秒的CPU负载、内存占用大小,得出训练资源消耗的统计数据序列。
对于4个候选算法模型hk(x),分别执行如下步骤进行模型测试:
先计算预测推理结果,并得到模型测试的性能:
﹛pk 1,pk 2,…,trk
其中:
pk 1,pk 2,…为模型测试的性能指标,与目标任务类型关联,例如分类问题,pk 1,pk 2,…可分别为召回率、准确率等;
trk表示候选算法模型hk(x)对测试样本的预测推理结果序列,用于业务风险评估。本实施例以分类模型为例,分别进行预测推理测试,并保存每个测试结果的信息:
trk(n)=yk,test (n)=hk(xtest (n))
其中:n=1,2,…,400000
再在完成模型测试后,计算测试性能:
根据测试数据集dtest和算法模型hk(x),计算召回率和准确率指标:
召回率:
准确率:
Figure BDA0002247976160000092
其中:
TP(k)表示算法模型hk(x)分类结果为True Positive的总数;
FN(k)表示算法模型hk(x)分类结果为False Negative的总数;
FP(k)表示算法模型hk(x)分类结果为False Positive的总数。
最后统计记录预测推理的资源消耗:
利用计算机软件统计模型的推理时长、计算资源消耗、存储资源消耗:
﹛tinfer,k,cinfer,k,minfer,k
采用周期采样的方式统计计算资源消耗和存储资源消耗,对每个测试数据来统计预测时长,不同的样本之间可能存在差异。具体地,按照固定的时间间隔统计计算资源消耗和存储资源消耗,这里固定的时间间隔设置为0.1秒,即统计出每0.1秒的CPU负载、内存占用大小,得出模型测试的资源消耗数据序列。
所述步骤S3中模型评估包括资源评估、性能评估、业务评估;
a.资源评估
包括对模型训练和模型测试资源消耗的数据统计,统计内容如下:
由模型训练的资源消耗数据序列得到计算资源、存储资源的统计信息:
﹛ctrainr,k,stat,mtrainr,k,stat
ctrainr,k,stat或mtrainr,k,stat可以是均值、峰值、方差等统计特征的序列。
由模型测试的资源消耗数据序列得到推理时长、计算资源、存储资源的统计信息:
﹛tinfer,k,stat,cinfer,k,stat,minfer,k,stat
tinfer,k,stat或cinfer,k,stat或minfer,k,stat可以是均值、峰值、方差等统计特征序列。本实施例中,根据测试资源消耗序列,得到预测推理的最大时长、CPU最高负载和存储最大占用:
﹛tinfer,k,MAX,cinfer,k,MAX,minfer,k,MAX
b.性能评估
由所述步骤S2中模型测试的性能指标pk 1,pk 2,…,计算模型测试的综合性能,记为testPerfk
testPerfk=f(pk 1,pk 2,…)
综合性能用于判断测试性能的好坏。
本实施例,根据模型测试性能pk 1,pk 2计算得到模型综合性能:
Figure BDA0002247976160000101
假设四个算法模型的综合性能计算结果为:{testPerf1,testPerf2,testPerf3,testPerf4}=﹛0.5,0.8,0.95,0.93﹜。
c.业务评估
先定义单个测试样本的业务风险函数,得出业务风险值rk (n)
rk (n)=g(ytest (n),trk (n)
其中:
trk (n)为算法模型hk(x)对第n个测试样本输入数据xtest (n)的预测推理结果,其目标结果为ytest (n)
再定义业务风险计算函数,得出总体业务风险,记为Riskk
Riskk=π(﹛rk (n),n=1,2,…,400000﹜)
业务风险计算函数π需根据实际业务需求来定义。
具体地,本实施例中,定义业务风险函数为离散的业务风险函数g,业务风险函数g变量如表1所示:
表1
真实类型/推理类型 C<sub>1</sub> C<sub>2</sub> C<sub>3</sub>
C1 0 0.12 0.90
C2 0.18 0 0.80
C3 0.21 0.35 0
可以通过查找表1计算出每个测试结果的风险,即业务代价rk (n)
rk (n)=g(Ctrue (n),Cinfer (n))
例如,在某测试样本的真实类型为C1的情况下,当预测推理结果分别识别为C1,C2,C3时,该测试样本的业务风险值rk (n)分别为0、0.12、0.90。
再统计出算法模型的总体业务风险。本实施例采用rk (n)的一阶期望来衡量算法模型hk(x)的总体业务风险:
Figure BDA0002247976160000111
其中,Pi,j为测试样本实际为第i类目标,但被模型预测推理识别为第j类的概率。此处假设四个算法模型总体业务风险{Risk1,Risk2,Risk3,Risk4}的计算结果为:﹛0.5,0.7,0.2,0.4﹜。
所述步骤S4中模型选择决策包括资源消耗、性能和业务风险三个方面的子策略,
其中:
资源消耗子策略记为ResRule,记为策略1:Null;
性能子策略记为PerfRule,记为策略2:testPerf>0.9;
业务风险子策略RiskRule,记为策略3:Risk<0.3;
模型选择策略SelectionRule;
则SelectionRule为:﹛ResRule,Perf Rule,RiskRule﹜。
根据SelectionRule挑出满足所有策略条件的算法模型子集,子集中可能包含零个、一个或多个算法模型。
若模型子集只有一个算法模型,选择该算法模型;
若模型子集有两个或两个以上的算法模型,则采用资源优先、性能优先、风险优先或综合评分的原则,选出最优算法模型。
所述资源优先为:选择计算资源或存储资源消耗最小的模型,对于选择资计算资源最小还是存储资源最小,需要根据实际系统设计需求确定。
所述风险优先为:选择业务风险最低的模型;或者,在计算资源允许的情况下,可以分析多模型联合能否获得更低的业务风险。
所述性能优先为:选择性能最优的模型;或者,在计算资源允许的情况下,可以分析多模型联合能否获得更好的性能。
所述综合评分为:将资源消耗、性能、业务风险进行评分并加权,得到综合评分,综合评分越高,选择优先级越高。
本实施例选择风险优先作为评选依据。
由于四个算法模型的综合性能{testPerf1,testPerf2,testPerf3,testPerf4}计算结果为:﹛0.5,0.8,0.95,0.93﹜,四个算法模型总体业务风险{Risk1,Risk2,Risk3,Risk4}计算结果为:﹛0.5,0.7,0.2,0.4﹜,其中只有算法模型h3(x)满足:testPerf>0.9、Risk<0.3,因此选择算法模型h3(x)用于实际业务预测推理。
所述步骤S5中,将选定的算法模型hk(x)应用于实际业务,实际业务的输入数据记为xin,得到预测推理结果,记为ypredict
ypredict=hk(xin)
并将预测数据(xin,ypredict)送入模型监控。
所述步骤S6中所述模型监控为:
先定义异常或关注场景,包括预测推理结果的概率分布与期望分布有差异、预测推理结果出现的小概率发生的事件次数高于特定限值、预测推理的下游模块出现功能异常等,可以根据业务特点定义更多的异常或关注场景。再统计预测推理结果的概率特征。本实施例根据业务特点估计识别目标C3的出现概率应低于3%,将关注场景定义为:当前时刻之前的100次预测推理中出现3次及以上的C3类型结果。根据异常或关注场景要求,判断是否出现异常或关注场景,如果出现则及时反馈给模型设置单元,作为模型迭代优化的依据。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (7)

1.一种机器学习模型选择方法,其特征在于,包括如下步骤:
步骤S1:模型设置,根据目标任务确定多个候选算法模型的类型,每种类型可包含多个子模型。算法模型记为hk(x),设置各算法模型的功能参数,并初始化待训练算法模型hk(x)的性能参数记为θk;K为候选算法模型hk(x)的总个数;
步骤S2:训练测试,包括模型训练和模型测试,利用训练数据集训练算法模型hk(x)找出影响算法性能的最优性能参数,得出模型训练性能和训练资源消耗数据序列,训练数据集样本总个数记为M;再利用测试数据集评估该算法模型hk(x)的泛化能力,得到的模型泛化能力性能指标分别记为:pk 1,pk 2,…,并得出模型测试的资源消耗数据序列,测试数据集样本总个数记为N;
步骤S3:模型评估,包括资源评估、性能评估、业务评估,根据模型训练和模型测试的资源消耗数据序列,得到资源评估结果,根据模型测试的若干性能指标,得到综合性能评估结果,根据算法模型hk(x)的测试集预测推理结果和业务风险函数评估算法模型hk(x),得到总体业务风险;
步骤S4:模型选择,预先定义模型选择决策,根据模型选择策略和模型评估结果选出采用的算法模型hk(x);
步骤S5:预测推理,将选出的算法模型hk(x)用于实际业务数据的预测推理,并将预测推理结果送入模型监控;
步骤S6:模型监控,通过模型监控实时分析预测结果,并监控异常结果,以便算法模型hk(x)迭代优化。
2.如权利要求1所述的机器学习模型选择方法,其特征在于,所述步骤S2中模型训练包括如下步骤:
a.将训练数据集记为:
dtrain=﹛(x(1),y(1)),x(2),y(2)),…(x(M),y(M))﹜
其中,
x(m)为第m个训练样本的输入数据;
y(m)为第m个训练样本的目标输出数据;
m=1,2,….M;M为训练数据集样本总个数。
b.对于每个候选算法模型hk(x),先计算算法模型hk(x)的最优性能参数,定义算法模型hk(x)目标函数为:
Objectivek=Cost(dtrain,hk(x))
通过迭代优化算法求出使Objectivek最小化的参数θk,即为最优性能参数;
c.通过dtrain、hk(x)、最优性能参数计算出表征训练质量好坏的性能指标;
d.统计训练过程中的计算资源消耗、存储资源消耗等信息:
﹛ctrain,k,mtrain,k
可以采用周期采样的方式统计计算资源、存储资源,得出模型训练的资源消耗数据序列;
所述步骤S2中模型测试包括如下步骤:
a.将测试数据集记为:
dtest=﹛(xtest (1),ytest (1)),xtest (2),ytest (2)),…(xtest (N),ytest (N))﹜
其中:
xtest (n)为第n个测试样本的输入数据;
ytest (n)为第n个测试样本的目标输出数据;
n=1,2,…N;N为测试数据集样本总个数。
b.对于每个候选算法模型hk(x),先计算预测推理结果,并得到模型测试的性能:
﹛pk 1,pk 2,…,trk
其中:
pk 1,pk 2,…为模型测试的性能指标,与目标任务类型关联;
trk表示候选算法模型hk(x)对测试样本的预测推理结果序列,用于业务风险评估;
c.统计记录预测推理的资源消耗,包括统计模型推理时长、计算资源消耗、存储资源消耗:
﹛tinfer,k,cinfer,k,minfer,k
可采用周期采样的方式统计推理时长、计算资源、存储资源,得出模型测试的资源消耗数据序列。
3.如权利要求1所述的机器学习模型选择方法,其特征在于,所述步骤S3中模型评估包括资源评估、性能评估、业务评估;
a.资源评估
包括对模型训练和模型测试资源消耗的数据统计,统计内容如下:
由模型训练的资源消耗数据序列得到计算资源、存储资源的统计信息:
﹛ctrainr,k,stat,mtrainr,k,stat
ctrainr,k,stat或mtrainr,k,stat可以是均值、峰值、方差等统计特征的序列;
由模型测试的资源消耗数据序列得到推理时长、计算资源、存储资源的统计信息:
﹛tinfer,k,stat,cinfer,k,stat,minfer,k,stat
tinfer,k,stat或cinfer,k,stat或minfer,k,stat可以是均值、峰值、方差等统计特征的序列。
b.性能评估
由所述步骤S2中模型测试的性能指标pk 1,pk 2,…,计算模型测试的综合性能,记为testPerfk
testPerfk=f(pk 1,pk 2,…)
综合性能用于判断测试性能的好坏。
c.业务评估
先定义单个测试样本的业务风险函数,得出业务风险值rk (n)
rk (n)=g(ytest (n),trk (n))
其中:
trk (n)为算法模型hk(x)对第n个测试样本输入数据xtest (n)的预测推理结果,其目标结果为ytest (n)
再定义业务风险计算函数,得出总体业务风险,记为Riskk
Riskk=π(﹛rk (n),n=1,2,…,N﹜)
业务风险计算函数π需根据实际业务需求来定义。
4.如权利要求1所述的机器学习模型选择方法,其特征在于,所述步骤S4中模型选择决策包括资源消耗、性能和业务风险三个方面的子策略,
其中:
资源消耗子策略记为ResRule;
性能子策略记为Perf Rule;
业务风险子策略RiskRule;
模型选择策略SelectionRule;
则SelectionRule为:﹛ResRule,PerfRule,RiskRule﹜
根据SelectionRule挑出满足所有策略条件的算法模型子集,子集中可能包含零个、一个或多个算法模型。
若模型子集只有一个算法模型,选择该算法模型;
若模型子集有两个或两个以上的算法模型,则采用资源优先、性能优先、风险优先或综合评分的原则,选出最优算法模型。
5.如权利要求4所述的机器学习模型选择方法,其特征在于,
所述资源优先为:选择计算资源或存储资源消耗最小的模型,对于选择资计算资源最小还是存储资源最小,需要根据实际系统设计需求确定。
所述风险优先为:选择业务风险最低的模型;或者,在计算资源允许的情况下,可以分析多模型联合能否获得更低的业务风险。
所述性能优先为:选择性能最优的模型;或者,在计算资源允许的情况下,可以分析多模型联合能否获得更好的性能。
所述综合评分为:将资源消耗、性能、业务风险进行评分并加权,得到综合评分,综合评分越高,选择优先级越高。
6.如权利要求1所述的机器学习模型选择方法,其特征在于,所述步骤S5中,将选定的算法模型hk(x)应用于实际业务,实际业务的输入数据记为xin,得到预测推理结果,记为ypredict
ypredict=hk(xin)
并将预测数据(xin,ypredict)送入模型监控。
7.如权利要求1所述的机器学习模型选择方法,其特征在于,所述步骤S6中所述模型监控为:
先定义异常或关注场景;
再统计预测推理结果的概率特征;
根据异常或关注场景要求,判断是否出现异常或关注场景,如果出现则及时反馈给模型设置单元,作为模型迭代优化的依据。
CN201911034545.3A 2019-10-25 2019-10-25 一种机器学习模型选择方法 Pending CN110796270A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911034545.3A CN110796270A (zh) 2019-10-25 2019-10-25 一种机器学习模型选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911034545.3A CN110796270A (zh) 2019-10-25 2019-10-25 一种机器学习模型选择方法

Publications (1)

Publication Number Publication Date
CN110796270A true CN110796270A (zh) 2020-02-14

Family

ID=69441863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911034545.3A Pending CN110796270A (zh) 2019-10-25 2019-10-25 一种机器学习模型选择方法

Country Status (1)

Country Link
CN (1) CN110796270A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242304A (zh) * 2020-03-05 2020-06-05 北京物资学院 O-ran系统中基于联邦学习的人工智能模型处理方法和装置
CN111415015A (zh) * 2020-03-27 2020-07-14 支付宝(杭州)信息技术有限公司 业务模型训练方法、装置、系统及电子设备
CN111582498A (zh) * 2020-04-30 2020-08-25 重庆富民银行股份有限公司 基于机器学习的qa辅助决策方法及系统
CN112232019A (zh) * 2020-10-19 2021-01-15 上海国微思尔芯技术股份有限公司 一种逻辑资源评估方法
CN112817839A (zh) * 2020-09-08 2021-05-18 腾讯科技(深圳)有限公司 人工智能引擎测试方法、平台及终端、计算设备和存储介质
CN113065658A (zh) * 2021-03-30 2021-07-02 山东英信计算机技术有限公司 一种提高人工智能推论结果正确率的方法及系统
CN113449753A (zh) * 2020-03-26 2021-09-28 中国电信股份有限公司 业务风险预测方法、装置和系统
CN114331238A (zh) * 2022-03-17 2022-04-12 北京航天晨信科技有限责任公司 智能模型算法优选方法、系统、存储介质及计算机设备
CN114443506A (zh) * 2022-04-07 2022-05-06 浙江大学 一种用于测试人工智能模型的方法及装置
CN114492214A (zh) * 2022-04-18 2022-05-13 支付宝(杭州)信息技术有限公司 利用机器学习的选择算子确定、策略组合优化方法及装置
WO2023274213A1 (zh) * 2021-06-29 2023-01-05 华为技术有限公司 一种数据处理方法及相关装置
US12112287B1 (en) * 2022-09-28 2024-10-08 Amazon Technologies, Inc. Automated estimation of resources related to testing within a service provider network

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242304A (zh) * 2020-03-05 2020-06-05 北京物资学院 O-ran系统中基于联邦学习的人工智能模型处理方法和装置
CN113449753B (zh) * 2020-03-26 2024-01-02 天翼云科技有限公司 业务风险预测方法、装置和系统
CN113449753A (zh) * 2020-03-26 2021-09-28 中国电信股份有限公司 业务风险预测方法、装置和系统
CN111415015A (zh) * 2020-03-27 2020-07-14 支付宝(杭州)信息技术有限公司 业务模型训练方法、装置、系统及电子设备
CN111582498A (zh) * 2020-04-30 2020-08-25 重庆富民银行股份有限公司 基于机器学习的qa辅助决策方法及系统
CN112817839B (zh) * 2020-09-08 2024-03-12 腾讯科技(深圳)有限公司 人工智能引擎测试方法、平台及终端、计算设备和存储介质
CN112817839A (zh) * 2020-09-08 2021-05-18 腾讯科技(深圳)有限公司 人工智能引擎测试方法、平台及终端、计算设备和存储介质
CN112232019B (zh) * 2020-10-19 2023-03-07 上海思尔芯技术股份有限公司 一种逻辑资源评估方法
CN112232019A (zh) * 2020-10-19 2021-01-15 上海国微思尔芯技术股份有限公司 一种逻辑资源评估方法
CN113065658A (zh) * 2021-03-30 2021-07-02 山东英信计算机技术有限公司 一种提高人工智能推论结果正确率的方法及系统
WO2023274213A1 (zh) * 2021-06-29 2023-01-05 华为技术有限公司 一种数据处理方法及相关装置
CN114331238A (zh) * 2022-03-17 2022-04-12 北京航天晨信科技有限责任公司 智能模型算法优选方法、系统、存储介质及计算机设备
CN114443506A (zh) * 2022-04-07 2022-05-06 浙江大学 一种用于测试人工智能模型的方法及装置
CN114443506B (zh) * 2022-04-07 2022-06-10 浙江大学 一种用于测试人工智能模型的方法及装置
CN114492214A (zh) * 2022-04-18 2022-05-13 支付宝(杭州)信息技术有限公司 利用机器学习的选择算子确定、策略组合优化方法及装置
US12112287B1 (en) * 2022-09-28 2024-10-08 Amazon Technologies, Inc. Automated estimation of resources related to testing within a service provider network

Similar Documents

Publication Publication Date Title
CN110796270A (zh) 一种机器学习模型选择方法
Maldonado et al. Profit-based feature selection using support vector machines–General framework and an application for customer retention
CN116596095B (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
Singhal et al. Review of bagging and boosting classification performance on unbalanced binary classification
CN110379521B (zh) 基于信息论的医疗数据集特征选择方法
CN112241494A (zh) 基于用户行为数据的关键信息推送方法及装置
CN109636212B (zh) 作业实际运行时间的预测方法
CN112801231B (zh) 用于业务对象分类的决策模型训练方法和装置
CN106952190A (zh) 虚假房源录入行为识别与预警系统
CN112149884A (zh) 一种面向大规模学员的学业预警监测方法
CN112733935A (zh) 一种基于Stacking算法的渔船捕捞方式预测方法
Yu et al. A novel approach to predictive analysis using attribute-oriented rough fuzzy sets
CN104537383A (zh) 一种基于粒子群的海量组织机构数据分类方法及系统
CN114154252A (zh) 新能源汽车动力电池系统失效模式的风险评估方法及装置
Blanzeisky et al. Using Pareto simulated annealing to address algorithmic bias in machine learning
Halawi et al. Evaluating Predictive Performance
Nikolikj et al. Sensitivity Analysis of RF+ clust for Leave-one-problem-out Performance Prediction
Papadopoulos et al. Reliable Confidence Intervals for Software Effort Estimation.
CN113393023B (zh) 模具质量评估方法、装置、设备及存储介质
CN111104950A (zh) 基于神经网络的k-NN算法中k值预测方法及装置
Chiu An early software-quality classification based on improved grey relational classifier
CN115221955A (zh) 基于样本差异分析的多深度神经网络参数融合系统及方法
US11580358B1 (en) Optimization with behavioral evaluation and rule base coverage
Puleko et al. The Scalar Metric of Classification Algorithm Choice in Machine Learning Problems Based on the Scheme of Nonlinear Compromises.
CN114049159A (zh) 银行客户流失预测方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230322

Address after: 528313 401-118, 4th Floor, Building 18, Shunlian Machinery City, No. 18, Xingye 4th Road, Guanglong Industrial Park, Chihua Neighborhood Committee, Chencun Town, Shunde District, Foshan City, Guangdong Province

Applicant after: Linker Technology (Foshan) Co.,Ltd.

Address before: 1303-1305, 13 / F, block B2, building 9, Shenzhen Bay science and technology ecological park, 1819 Shahe West Road, Yuehai street, Nanshan District, Shenzhen, Guangdong 518000

Applicant before: SHENZHEN COOS Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230523

Address after: 518000 Building A, Building 1, Shenzhen International Innovation Valley, Dashi 1st Road, Xili Community, Xili Street, Nanshan District, Shenzhen City, Guangdong Province, 1001

Applicant after: Shenzhen Qianshu Technology Co.,Ltd.

Address before: 528313 401-118, 4th Floor, Building 18, Shunlian Machinery City, No. 18, Xingye 4th Road, Guanglong Industrial Park, Chihua Neighborhood Committee, Chencun Town, Shunde District, Foshan City, Guangdong Province

Applicant before: Linker Technology (Foshan) Co.,Ltd.

TA01 Transfer of patent application right