CN111859592A - 参数确定方法和装置以及电子设备、计算机可读存储介质 - Google Patents

参数确定方法和装置以及电子设备、计算机可读存储介质 Download PDF

Info

Publication number
CN111859592A
CN111859592A CN201910277910.7A CN201910277910A CN111859592A CN 111859592 A CN111859592 A CN 111859592A CN 201910277910 A CN201910277910 A CN 201910277910A CN 111859592 A CN111859592 A CN 111859592A
Authority
CN
China
Prior art keywords
parameter
model
model training
determining
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910277910.7A
Other languages
English (en)
Other versions
CN111859592B (zh
Inventor
陈彬彬
潘立维
吴云崇
杨斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910277910.7A priority Critical patent/CN111859592B/zh
Priority claimed from CN201910277910.7A external-priority patent/CN111859592B/zh
Publication of CN111859592A publication Critical patent/CN111859592A/zh
Application granted granted Critical
Publication of CN111859592B publication Critical patent/CN111859592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)

Abstract

本发明实施例提供了一种参数确定方法和装置以及电子设备、计算机可读存储介质。该方法包括:根据模型训练期望时长和训练数据,确定目标参数选取方法;根据所述目标参数选取方法,确定目标参数组合。本发明实施例通过根据模型训练期望时长所确定的参数选取方法,来从参数空间中选出最合适的参数组合,在提高效率、节省计算资源的同时,提高了参数组合选取的准确性,进而能够提高模型的性能。

Description

参数确定方法和装置以及电子设备、计算机可读存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种参数确定方法和装置以及电子设备、计算机可读存储介质。
背景技术
在计算机建模过程中,模型参数的选择非常重要,将直接影响模型输出结果的准确性,因此需要从参数空间中选出最佳的参数组合,以使得模型具有最佳性能。现有的格点搜索会采用穷举的方式将各参数的所有组合都运行一遍,从而寻找出最佳参数组合。但是,这种方式效率非常低,且需要耗费大量的计算资源。
为了降低搜索空间,现有技术中一般采用一些参数选取方法(例如,球面试验设计、均匀试验设计、正交试验设计等),来从整个参数空间选取出的一些参数组合以提高效率。
发明人在实现本发明的过程中,发现现有技术至少存在如下问题:参数选取方法的选择对操作人员的业务能力要求比较高,对于一般用户来说,很难找到适合的参数选取方法,使得确定的参数准确性较低。
发明内容
本发明实施例提供一种参数确定方法和装置以及电子设备、计算机可读存储介质,以解决现有技术中不具备较高业务能力的用户所确定的参数准确性低的缺陷。
为达到上述目的,本发明实施例提供了一种参数确定方法,包括:
根据模型训练期望时长和训练数据,确定目标参数选取方法;
根据所述目标参数选取方法,确定目标参数组合。
本发明实施例还提供了一种参数确定装置,包括:
确定模块,用于根据模型训练期望时长和训练数据,确定目标参数选取方法;
参数选取模块,用于根据所述目标参数选取方法,确定目标参数组合。
本发明实施例还提供了一种电子设备,包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,以用于:
执行本发明实施例提供的参数确定方法。
本发明实施例还提供了一种计算机可读存储介质,在所述计算机可读存储介质上存储有指令,所述指令用于执行本发明实施例提供的参数确定方法。
本发明实施例提供的参数确定方法和装置以及电子设备、计算机可读存储介质,通过根据模型训练期望时长所确定的参数选取方法,来从参数空间中选出最合适的参数组合,在提高效率、节省计算资源的同时,提高了参数组合选取的准确性,进而能够提高模型的性能。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的业务系统的系统框图;
图2为本发明提供的参数确定方法一个实施例的流程图;
图3为本发明提供的参数确定方法另一个实施例的流程图;
图4为本发明提供的参数确定装置一个实施例的结构示意图;
图5为本发明提供的参数确定装置另一个实施例的结构示意图;
图6为本发明提供的电子设备实施例的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在现有技术中,为了降低选取最佳参数组合的搜索空间,通常采用一些参数选取方法来从整个参数空间选取出的一些参数组合,以提高效率。但是,参数选取方法的选择对用户(模型的操作人员)的业务能力要求比较高,需要具有较高的理论及实践知识,对于一般用户来说,很难找到适合的参数选取方法,因此,使得最终确定的参数组合准确性较低。
因此,本申请提出了一种参数确定方案,其主要原理是:通过用户期望完成模型训练所需要的时长来自动确定目标参数选取方法,用户无需具备丰富的经验和专业的知识,就能够仅输入训练数据和期望时长,来使系统自动为其推荐的适合的方法,然后,再根据选取的目标参数选取方法,将搜索空间从整个参数空间降低到使用目标参数选取方法所选取出的候选参数组合,从而能够提高效率并节省计算资源,同时,根据用户的约束条件确定的目标参数选取方法,所选取出的参数组合更加准确,能够提高例如机器学习模型的计算模型的性能。
本发明实施例提供的方法可应用于任何具有数据处理能力的业务系统。图1为本发明实施例提供的业务系统的系统框图,图1所示的结构仅仅是本发明的技术方案可以应用的业务系统的示例之一。如图1所示,该业务系统中包括参数确定装置。该装置包括:确定模块和参数选取模块,可以用来执行下述图2和图3所示的处理流程。在该业务系统中,首先,根据模型训练期望时长和训练数据,来确定目标参数选取方法;然后,根据所确定的目标参数选取方法,从参数空间中选出目标参数组合。用户无需具备丰富的经验和专业的知识,就能够仅输入训练数据和模型训练期望时长,来使系统自动为其推荐的适合的方法,以降低搜索空间,并选出最合适的参数组合,在提高效率、节省计算资源的同时,能够提高参数组合选取的准确性,进而能够提高模型的性能。
值得注意的是,根据本发明实施例,用户可以通过各种输入界面/介质来输入模型训练期望时长。而在现有技术中,用户需要掌握比较专业的知识和丰富的经验,来输入模型的各种参数,以便于进行模型训练,并且如果使用所输入的参数训练出的模型不符合预期,则还需要重新尝试新的参数来获得用户想要的训练模型。而本发明只需要用户输入期望的训练时长,就能够自动地尝试各种参数组合来进行模型训练,从而最终为用户提供符合用户要求的训练模型供用户直接使用。因此,与现有技术相比,本方案大大降低了对于用户的专业知识和经验的要求,简化了用户的输入,并且能够根据用户指定的时间,选择能够在规定时间内训练出用户想要的模型的参数组合。
上述实施例是对本发明实施例的技术原理和示例性的应用框架的说明,下面通过多个实施例来进一步对本发明实施例具体技术方案进行详细描述。
实施例一
图2为本发明提供的参数确定方法一个实施例的流程图,该方法的执行主体可以为上述业务系统,也可以为具有数据处理能力的各种服务器或终端设备,也可以为集成在这些设备上的装置或芯片。如图2所示,该参数确定方法包括如下步骤:
S201,根据模型训练期望时长和训练数据,确定目标参数选取方法。
在本发明实施例中,模型训练期望时长是指用户期望完成模型训练所需要的时间长度。在获取到训练数据后,可以根据训练数据对模型进行训练。计算在模型训练期望时长内能够完成模型训练的次数,根据计算出的次数来确定目标参数选取方法。
S202,根据目标参数选取方法,确定目标参数组合。
在本发明实施例中,当确定了目标参数选取方法后,可以根据该目标参数选取方法确定目标参数组合,当然,如果模型只需要确定一个参数时,确定目标参数组合包括确定一个目标参数的情形。具体地,在确定目标参数组合时,可以根据确定的目标参数选取方法,从参数空间中选出数组参数组合作为候选参数组合,然后可以对各候选参数组合进行评估。例如,可以分别将各候选参数组合输入到模型中,根据对模型的各项指标进行评估,来选出一组最优的参数组合,作为目标参数组合。
本发明实施例提供的参数确定方法,通过根据用户期望完成模型训练的时间长度所确定的参数选取方法,来从参数空间中选出数组候选参数组合,以降低搜索空间,并对选出的候选参数组合进行评估,以选出最合适的参数组合,在提高效率、节省计算资源的同时,提高了参数组合选取的准确性,进而能够提高模型的性能。
实施例二
图3为本发明提供的参数确定方法另一个实施例的流程图。如图3所示,在上述图2所示实施例的基础上,本实施例提供的参数确定方法还可以包括以下步骤:
S301,获取一组随机参数组合。
在本发明实施例中,在确定目标参数选取方法时,需要首先获取一组随机参数组合。可以首先获取参数列表,例如,该参数列表可以包括但不限于下述内容:特征是否进行正则化处理、离散特征编码的类型、是否进行特征降维、是否进行特征筛选、模型类型、模型参数等。然后为该参数列表中的各参数设置随机值,从而形成一组随机参数组合。例如,针对上述参数列表,随机形成的随机参数组合可以为:特征进行正则化处理、离散特征编码的类型为one-hot编码、进行特征降维、进行特征筛选、模型类型为随机森林模型、模型的树深度为5、模型的树个数为100等。
S302,根据随机参数组合设置第一模型,将训练数据输入到第一模型中进行模型训练,获取完成一次模型训练所需要的时间。
在本发明实施例中,按照上述随机参数组合设置第一模型后,将用户输入的训练数据输入到该第一模型中进行模型训练,并记录完成一次训练所需要的时间。在这里第一模型包括机器学习模型和统计模型,其中,机器学习模型包括深度学习模型、神经网络模型等;统计模型包括时间序列模型,如,差分整合移动平均自回归(Auto RegressiveIntegrated Moving Average;以下简称:ARIMA)模型等。
S303,根据完成一次模型训练所需要的时间,计算在模型训练期望时长的范围内的模型训练完成次数。
在本发明实施例中,根据上述获取到的完成一次训练所需要的时间、以及用户输入的模型训练期望时长,可以计算出在该模型训练期望时长中能够完成几次模型训练,得到模型训练完成次数。
S304,根据模型训练完成次数,确定目标参数选取方法。
在本发明实施例中,不同的参数选取方法确定参数所需要进行模型训练的次数各不相同,即,不同的预设参数选取方法具有不同的次数指标阈值。因此,在确定目标参数选取方法时,可以分别获取多个预设参数选取方法的次数指标阈值;然后,在次数指标阈值不大于上述模型训练完成次数的预设参数选取方法中,将次数指标阈值最大的预设参数选择方法,确定为目标参数选择方法。也就是说,在获取到各预设参数选取方法的次数指标阈值后,可以首先排除无法在模型训练期望时长内完成参数选取的方法,即,次数指标阈值大于模型训练完成次数的预设参数选取方法;由于进行参数选取所需要完成的模型训练的次数越多,该参数选取方法所选取出的参数组合准确性越高,因此,在能够在模型训练期望时长内完成参数选取的方法中,选择次数指标阈值最大的预设参数选择方法作为目标参数选择方法。
另外,在本发明实施例中,各预设参数选择方法包括但不限于:球面试验方法、均匀试验方法或正交试验方法。
S305,根据目标参数选取方法,从参数空间选取数组候选参数组合。
S306,根据数组候选参数组合设置第一模型,获取该第一模型的评估指标。
在本发明实施例中,当根据目标参数选取方法从参数空间中选出数组候选参数组合时,分别按照候选参数组合设置第一模型,并分别获取该第一模型在不同候选参数组合下的评估指标。当第一模型为回归任务模型时,评估指标可以采用均方根误差(root meansquared error;简称:RMSE);当该第一模型为分类任务模型时,评估指标可以采用交叉熵(cross-entropy)。
S307,基于第一模型,将评估指标的最小值对应的候选参数组合确定为目标参数组合。
在本发明实施例中,可以基于上述第一模型,将评估指标的最小值所对应的候选参数组合确定为目标参数组合。
另外,本发明实施例提供的参数确定方法,进一步还可以包括:接收用户通过输入界面输入的模型训练期望时长。
本发明实施例提供的参数确定方法,根据用户期望完成模型训练的时间长度、及各预设参数选取方法的次数指标阈值来确定目标参数选取方法,进而根据目标参数选取方法从参数空间中选出数组候选参数组合,以降低搜索空间,并对选出的候选参数组合进行评估,以选出在模型训练期望时长内能够完成训练任务的最佳参数组合,在提高效率、节省计算资源的同时,提高了参数组合选取的准确性,进而能够提高训练模型的性能。
实施例三
图4为本发明提供的参数确定装置一个实施例的结构示意图,可用于执行如图2所示的方法步骤。如图4所示,该参数确定装置可以包括:确定模块41和参数选取模块42。
其中,确定模块41用于根据模型训练期望时长和训练数据,确定目标参数选取方法,该模型训练期望时长为用户期望完成模型训练所需要的时间长度;参数选取模块42用于根据目标参数选取方法,确定目标参数组合。
在本发明实施例中,确定模块41在获取到训练数据后,可以根据训练数据对模型进行训练,计算在模型训练期望时长内能够完成模型训练的次数,根据计算出的次数来确定目标参数选取方法。当确定模块41确定了目标参数选取方法后,参数选取模块42可以根据该目标参数选取方法确定目标参数组合,当然,如果模型只需要确定一个参数时,确定目标参数组合包括确定一个目标参数的情形。具体地,参数选取模块42在确定目标参数组合时,可以根据确定的目标参数选取方法,从参数空间中选出数组参数组合作为候选参数组合,然后对各候选参数组合进行评估。例如,可以分别将各候选参数组合输入到第一模型中,根据对第一模型的各项指标进行评估,来选出一组最优的参数组合,作为目标参数组合。
本发明实施例提供的参数确定装置,通过根据用户期望完成模型训练的时间长度所确定的参数选取方法,来从参数空间中选出数组候选参数组合,以降低搜索空间,并对选出的候选参数组合进行评估,以选出最合适的参数组合,在提高效率、节省计算资源的同时,提高了参数组合选取的准确性,进而能够提高训练模型的性能。
实施例四
图5为本发明提供的参数确定装置另一个实施例的结构示意图,可以用于执行如图3所示的方法步骤。如图5所示,在上述图4所示实施例的基础上,参数选取模块42可以包括:参数选取单元421和评估单元422。
其中,参数选取单元421可以用于根据目标参数选取方法,从参数空间选取数组候选参数组合;评估单元422可以用于对候选参数组合进行评估,根据评估结果从候选参数组合中确定目标参数组合。
在本发明实施例中,参数选取单元421可以根据确定模块41所确定的目标参数选取方法,从参数空间选取数组候选参数组合;然后,由评估单元422对参数选取单元421选取出的数组候选参数组合进行评估,根据评估结果从数组候选参数组合中确定目标参数组合。
另一方面,在本发明实施例提供的参数确定装置中,确定模块41可以包括:第一获取单元411、模型训练单元412、计算单元413和确定单元414。
其中,第一获取单元411可以用于获取一组随机参数组合;模型训练单元412可以用于根据随机参数组合设置第一模型,将训练数据输入到该第一模型中进行模型训练,获取完成一次模型训练所需要的时间;计算单元413可以用于根据该完成一次模型训练所需要的时间,计算在模型训练期望时长的范围内的模型训练完成次数;确定单元414可以用于根据该模型训练完成次数,确定目标参数选择方法。
在本发明实施例中,确定模块41在确定目标参数选取方法时,首先,可以由第一获取单元411获取一组随机参数组合,第一获取单元411可以首先获取参数列表,例如,该参数列表可以包括但不限于下述内容:特征是否进行正则化处理、离散特征编码的类型、是否进行特征降维、是否进行特征筛选、模型类型、模型参数等。然后第一获取单元411为该参数列表中的各参数设置随机值,从而形成一组随机参数组合。例如,针对上述参数列表,随机形成的随机参数组合可以为:特征进行正则化处理、离散特征编码的类型为one-hot编码、进行特征降维、进行特征筛选、模型类型为随机森林模型、模型的树深度为5、模型的树个数为100等。
然后,模型训练单元412根据第一获取单元411获取的随机参数组合设置第一模型,将训练数据输入到该第一模型中进行模型训练,以获取完成一次模型训练所需要的时间,在这里第一模型包括机器学习模型和统计模型,其中,机器学习模型包括深度学习模型、神经网络模型等;统计模型包括时间序列模型,如,ARIMA模型等。然后,计算单元413根据模型训练单元412获取到的完成一次模型训练所需要的时间,计算在模型训练期望时长的范围内的模型训练完成次数,最后,由确定单元414根据计算单元413计算出的模型训练完成次数,确定目标参数选择方法。
进一步地,确定单元414可以具体用于分别获取多个预设参数选取方法的次数指标阈值,该次数指标阈值为预设参数选取方法确定参数所需要进行模型训练的次数;并在次数指标阈值不大于模型训练完成次数的预设参数选取方法中,将次数指标阈值最大的预设参数选择方法,确定为目标参数选择方法。各预设参数选择方法包括但不限于:球面试验方法、均匀试验方法或正交试验方法。
另外,第一获取单元411可以具体用于获取参数列表,为参数列表中的各参数设置随机值,以形成随机参数组合。
更进一步地,在本发明实施例中,上述评估单元422可以具体用于根据数组候选参数组合设置第一模型,获取第一模型的评估指标,基于该第一模型,将评估指标的最小值对应的候选参数组合确定为目标参数组合。
在本发明实施例中,评估单元422在对候选参数组合进行评估时,可以根据参数选取单元421选出的数组候选参数组合设置第一模型,获取第一模型的评估指标,然后基于该第一模型,将评估指标的最小值对应的候选参数组合确定为目标参数组合。具体地,评估指标可以包括:均方根误差或交叉熵等。
另外,本发明实施例提供的参数确定装置,进一步还可以包括:输入模块,该输入模块可以用于接收用户通过输入界面输入的模型训练期望时长。
本发明实施例中各模块的功能详见上述方法实施例中的具体描述,在此不再赘述。
本发明实施例提供的参数确定装置,根据用户期望完成模型训练的时间长度、及各预设参数选取方法的次数指标阈值来确定目标参数选取方法,进而根据目标参数选取方法从参数空间中选出数组候选参数组合,以降低搜索空间,并对选出的候选参数组合进行评估,以选出在模型训练期望时长内能够完成训练任务的最佳参数组合,在提高效率、节省计算资源的同时,提高了参数组合选取的准确性,进而能够提高训练模型的性能。
实施例五
以上描述了参数确定装置的内部功能和结构,该装置可实现为一种电子设备。图6为本发明提供的电子设备实施例的结构示意图。如图6所示,该电子设备包括存储器61和处理器62。
存储器61,用于存储程序。除上述程序之外,存储器61还可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器61可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器62,与存储器61耦合,执行存储器61所存储的程序,以用于执行前述实施例中所描述的参数确定方法的操作步骤。
此外,处理器62也可以包括前述实施例所描述的各种模块以执行参数确定操作,并且存储器61可以例如用于存储这些模块执行操作所需要的数据和/或所输出的数据。
进一步,如图6所示,电子设备还可以包括:通信组件63、电源组件64、音频组件65、显示器66等其它组件。图6中仅示意性给出部分组件,并不意味着电子设备只包括图6所示组件。
通信组件63被配置为便于电子设备和其他设备之间有线或无线方式的通信。电子设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件63经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件63还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
电源组件64,为电子设备的各种组件提供电力。电源组件64可以包括电源管理系统,一个或多个电源,及其他与为电子设备生成、管理和分配电力相关联的组件。
音频组件65被配置为输出和/或输入音频信号。例如,音频组件65包括一个麦克风(MIC),当电子设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器61或经由通信组件63发送。在一些实施例中,音频组件65还包括一个扬声器,用于输出音频信号。
显示器66包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (22)

1.一种参数确定方法,其特征在于,包括:
根据模型训练期望时长和训练数据,确定目标参数选取方法;
根据所述目标参数选取方法,确定目标参数组合。
2.根据权利要求1所述的参数确定方法,其特征在于,所述模型训练期望时长为用户期望完成模型训练所需要的时间长度。
3.根据权利要求1所述的参数确定方法,其特征在于,所述根据所述目标参数选取方法,确定目标参数组合,包括:
根据所述目标参数选取方法,从参数空间选取数组候选参数组合;
对所述候选参数组合进行评估,根据评估结果从所述候选参数组合中确定目标参数组合。
4.根据权利要求1至3中任一权利要求所述的参数确定方法,其特征在于,所述根据模型训练期望时长和训练数据,确定目标参数选取方法,包括:
获取一组随机参数组合;
根据所述随机参数组合设置第一模型,将训练数据输入到所述第一模型中进行模型训练,获取完成一次模型训练所需要的时间;
根据所述完成一次模型训练所需要的时间,计算在所述模型训练期望时长的范围内的模型训练完成次数;
根据所述模型训练完成次数,确定目标参数选取方法。
5.根据权利要求4所述的参数确定方法,其特征在于,所述根据所述模型训练完成次数,确定目标参数选取方法,包括:
分别获取多个预设参数选取方法的次数指标阈值,所述次数指标阈值为采用所述预设参数选取方法确定参数所需要进行模型训练的次数;
在所述次数指标阈值不大于所述模型训练完成次数的预设参数选取方法中,将所述次数指标阈值最大的所述预设参数选择方法,确定为目标参数选择方法。
6.根据权利要求5所述的参数确定方法,其特征在于,所述预设参数选择方法包括:球面试验方法、均匀试验方法或正交试验方法。
7.根据权利要求4所述的参数确定方法,其特征在于,所述获取一组随机参数组合,包括:
获取参数列表;
为所述参数列表中的各参数设置随机值,以形成随机参数组合。
8.根据权利要求3所述的参数确定方法,其特征在于,所述对所述候选参数组合进行评估,根据评估结果从所述候选参数组合中确定目标参数组合,包括:
根据数组所述候选参数组合设置第一模型,获取所述第一模型的评估指标;
基于所述第一模型,将所述评估指标的最小值对应的所述候选参数组合确定为目标参数组合。
9.根据权利要求8所述的参数确定方法,其特征在于,所述评估指标包括:均方根误差或交叉熵。
10.根据权利要求1所述的参数确定方法,其特征在于,进一步包括:
接收用户通过输入界面输入的模型训练期望时长。
11.一种参数确定装置,其特征在于,包括:
确定模块,用于根据模型训练期望时长和训练数据,确定目标参数选取方法;
参数选取模块,用于根据所述目标参数选取方法,确定目标参数组合。
12.根据权利要求11所述的参数确定装置,其特征在于,所述模型训练期望时长为用户期望完成模型训练所需要的时间长度。
13.根据权利要求11所述的参数确定装置,其特征在于,所述参数选取模块包括:
参数选取单元,用于根据所述目标参数选取方法,从参数空间选取数组候选参数组合;
评估单元,用于对所述候选参数组合进行评估,根据评估结果从所述候选参数组合中确定目标参数组合。
14.根据权利要求11至13中任一权利要求所述的参数确定装置,其特征在于,所述确定模块包括:
第一获取单元,用于获取一组随机参数组合;
模型训练单元,用于根据所述随机参数组合设置第一模型,将训练数据输入到所述第一模型中进行模型训练,获取完成一次模型训练所需要的时间;
计算单元,用于根据所述完成一次模型训练所需要的时间,计算在所述模型训练期望时长的范围内的模型训练完成次数;
确定单元,用于根据所述模型训练完成次数,确定目标参数选择方法。
15.根据权利要求14所述的参数确定装置,其特征在于,所述确定单元具体用于,分别获取多个预设参数选取方法的次数指标阈值,所述次数指标阈值为所述预设参数选取方法确定参数所需要进行模型训练的次数;并在所述次数指标阈值不大于所述模型训练完成次数的预设参数选取方法中,将所述次数指标阈值最大的所述预设参数选择方法,确定为目标参数选择方法。
16.根据权利要求15所述的参数确定装置,其特征在于,所述预设参数选择方法包括:球面试验方法、均匀试验方法或正交试验方法。
17.根据权利要求14所述的参数确定装置,其特征在于,所述第一获取单元具体用于,获取参数列表,为所述参数列表中的各参数设置随机值,以形成随机参数组合。
18.根据权利要求13所述的参数确定装置,其特征在于,所述评估单元具体用于,根据数组所述候选参数组合设置第一模型,获取所述第一模型的评估指标,基于所述第一模型,将所述评估指标的最小值对应的所述候选参数组合确定为目标参数组合。
19.根据权利要求18所述的参数确定装置,其特征在于,所述评估指标包括:均方根误差或交叉熵。
20.根据权利要求11所述的参数确定装置,其特征在于,进一步包括:
输入模块,用于接收用户通过输入界面输入的模型训练期望时长。
21.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,以用于:
执行权利要求1至10中任一所述的参数确定方法。
22.一种计算机可读存储介质,在所述计算机可读存储介质上存储有指令,所述指令用于执行权利要求1至10中任一所述的参数确定方法。
CN201910277910.7A 2019-04-08 参数确定方法和装置以及电子设备、计算机可读存储介质 Active CN111859592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910277910.7A CN111859592B (zh) 2019-04-08 参数确定方法和装置以及电子设备、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277910.7A CN111859592B (zh) 2019-04-08 参数确定方法和装置以及电子设备、计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111859592A true CN111859592A (zh) 2020-10-30
CN111859592B CN111859592B (zh) 2024-10-22

Family

ID=

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765916A (zh) * 2015-03-31 2015-07-08 西南交通大学 一种高速列车动力学性能参数优化方法
US20150294246A1 (en) * 2014-04-10 2015-10-15 International Business Machines Corporation Selecting optimal training data set for service contract prediction
CN107273436A (zh) * 2017-05-24 2017-10-20 北京京东尚科信息技术有限公司 一种推荐模型的训练方法和训练装置
US20180121814A1 (en) * 2016-10-31 2018-05-03 Microsoft Technology Licensing, Llc Hyperparameter tuning
CN108229572A (zh) * 2018-01-17 2018-06-29 北京腾云天下科技有限公司 一种参数寻优方法及计算设备
CN109165249A (zh) * 2018-08-07 2019-01-08 阿里巴巴集团控股有限公司 数据处理模型构建方法、装置、服务器和用户端
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109558952A (zh) * 2018-11-27 2019-04-02 北京旷视科技有限公司 数据处理方法、系统、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150294246A1 (en) * 2014-04-10 2015-10-15 International Business Machines Corporation Selecting optimal training data set for service contract prediction
CN104765916A (zh) * 2015-03-31 2015-07-08 西南交通大学 一种高速列车动力学性能参数优化方法
US20180121814A1 (en) * 2016-10-31 2018-05-03 Microsoft Technology Licensing, Llc Hyperparameter tuning
CN107273436A (zh) * 2017-05-24 2017-10-20 北京京东尚科信息技术有限公司 一种推荐模型的训练方法和训练装置
CN108229572A (zh) * 2018-01-17 2018-06-29 北京腾云天下科技有限公司 一种参数寻优方法及计算设备
CN109165249A (zh) * 2018-08-07 2019-01-08 阿里巴巴集团控股有限公司 数据处理模型构建方法、装置、服务器和用户端
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109558952A (zh) * 2018-11-27 2019-04-02 北京旷视科技有限公司 数据处理方法、系统、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHIEN-FENG HUANG等: "Feature selection and parameter optimization of a Fuzzy-based Stock selection model using genetic algorithms", 《INTERNATIONAL JOURNAL OF FUZZY SYSTEMS》, vol. 14, no. 1, 31 March 2012 (2012-03-31) *
胡泽豪;卫炜;刘娟;刘琨;: "基于神经网络集的注射成型工艺参数多目标优化", 中国塑料, no. 08, 26 August 2010 (2010-08-26) *
龚永罡;汤世平;: "面向大数据的SVM参数寻优方法", 计算机仿真, no. 09, 15 September 2010 (2010-09-15) *

Similar Documents

Publication Publication Date Title
CN107844837B (zh) 针对机器学习算法进行算法参数调优的方法及系统
CN109976998B (zh) 一种软件缺陷预测方法、装置和电子设备
CN110969240B (zh) 一种深度卷积神经网络的剪枝方法、装置、设备及介质
CN110580217B (zh) 软件代码健康度的检测方法、处理方法、装置及电子设备
CN104991847A (zh) 一种内存泄露自动化检测方法、装置及移动终端
CN111861488A (zh) 机器学习模型对比方法及装置
CN113419941A (zh) 评估方法及装置、电子设备和计算机可读存储介质
CN107943571B (zh) 后台应用管控方法、装置、存储介质及电子设备
CN113191891A (zh) 数据处理方法、装置及系统
CN109948050B (zh) 信息处理方法和装置,存储介质和电子设备
CN109699017B (zh) 一种基于场景类型的用户推荐方法与设备
CN112906883B (zh) 用于深度神经网络的混合精度量化策略确定方法和系统
CN110580218A (zh) 软件代码复杂度的检测方法、装置及电子设备
CN111859592B (zh) 参数确定方法和装置以及电子设备、计算机可读存储介质
CN111859592A (zh) 参数确定方法和装置以及电子设备、计算机可读存储介质
CN110991641A (zh) 一种油藏类型分析方法、装置及电子设备
CN110659979A (zh) 预测违约损失率的方法和装置、存储介质及电子设备
CN111190801A (zh) 推荐系统测试方法、装置及电子设备
CN112231167A (zh) 云资源监控方法、装置、设备及存储介质
CN113157582B (zh) 测试脚本执行序列确定方法及装置
CN116167454A (zh) 智能化的二分类模型训练方法及装置
CN110457365A (zh) 基于时序并行的决策树生成方法及装置、电子设备
CN111461328B (zh) 一种神经网络的训练方法
CN112329943A (zh) 组合指标的甄选方法、装置、计算机设备及介质
CN112819079A (zh) 模型的采样算法匹配方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant