CN113282747A - 一种基于自动机器学习算法选择的文本分类方法 - Google Patents

一种基于自动机器学习算法选择的文本分类方法 Download PDF

Info

Publication number
CN113282747A
CN113282747A CN202110465097.3A CN202110465097A CN113282747A CN 113282747 A CN113282747 A CN 113282747A CN 202110465097 A CN202110465097 A CN 202110465097A CN 113282747 A CN113282747 A CN 113282747A
Authority
CN
China
Prior art keywords
algorithm
text
machine learning
classification
hyper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110465097.3A
Other languages
English (en)
Other versions
CN113282747B (zh
Inventor
俞扬
詹德川
周志华
方长婷
胡毅奇
李树桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202110465097.3A priority Critical patent/CN113282747B/zh
Publication of CN113282747A publication Critical patent/CN113282747A/zh
Application granted granted Critical
Publication of CN113282747B publication Critical patent/CN113282747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于自动机器学习算法选择的文本分类方法,基于级联式自动机器学习的思想,从多种机器学习算法中为文本分类任务配置最优算法,包括:(1)采用文本向量嵌入方法将文本语料数据编码成向量表示,生成文本分类数据集;(2)利用多摇臂赌博机算法从多个机器学习分类算法中选择一个算法;(3)利用超参优化方法自动为所选择的算法搜索一组超参数;(4)基于搜索到的超参数初始化相应算法的超参,并在文本分类数据集上训练模型;(5)重复步骤(2)到步骤(4),直到达到设定的迭代次数,将训练得到的多个分类模型中预测性能最好的模型用于文本分类任务。本方法能自动的为任务文本训练一个鲁棒的分类模型。

Description

一种基于自动机器学习算法选择的文本分类方法
技术领域
本发明涉及一种基于自动机器学习算法选择的文本分类方法,属于自动机器学习和文本分类技术领域。
背景技术
文本分类是自然语言处理中的一项基本任务,在搜索引擎、问答系统、意图识别、情感分析等众多领域都会涉及文本分类。现有的文本分类方法,其主要思想是利用某种机器学习分类算法,基于任务文本数据集训练一个分类模型判断待预测文本的类别。然而分类算法种类繁多,且没有一种算法适用于所有文本分类任务,需要专家利用丰富的知识和经验,根据任务文本数据的特性选择合适的算法,只有这样才能避免将时间浪费在尝试不适用的算法上。除此之外,每种算法都有或多或少的超参,超参的取值对模型最终的性能有着很大影响,因此需要人工对超参取值进行调节,这也是一项耗时繁琐的任务。
近年来自动机器学习技术取得了极大的进步,不同于传统机器学习,自动机器学习在训练分类模型的过程中可以利用数据自动的作出选择算法以及超参搜索的决策而不需要人的参与。但是以往的自动机器学习方法在搜索超参数时面临搜索空间维度过高的问题,无梯度优化方法对搜索空间的维度又非常敏感,因此以往的自动机器学习方法效率有待提升。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明将级联式自动机器学习方法应用于文本分类。级联式自动机器学习将算法选择和超参搜索分级处理,上级利用策略选择算法,下级负责为所选算法搜索超参数,分级方式可以降低超参搜索空间维度,提升搜索效率。通过多次决策自主训练并优化多个分类模型,从而获得最适用于任务文本的模型。并且本发明使用的级联式自动机器学习方法,能够确保获得鲁棒性不输于人工训练的模型,同时也能够大幅度降低文本分类任务的人工成本。
技术方案:一种基于自动机器学习算法选择的文本分类方法,分级处理训练文本分类模型过程中的算法选择和超参搜索,上级采取策略选择算法,下级为所选算法搜索超参数。利用多摇臂赌博机算法自主选择机器学习算法,并用无梯度优化方法为所选算法搜索超参数,配置好超参数的算法在文本分类数据集上训练得到分类模型。重复选择算法、搜索超参数和训练模型的过程,可以得到多个不同配置的算法训练的模型,将其中性能最好的模型用于待预测文本。主要包括以下步骤:
步骤一:基于任务文本环境收集文本语料数据集,生成文本分类数据集。
步骤二:选择多种机器学习算法构建摇臂,由于为一个算法搜索超参数的过程是多摇臂赌博机的一个摇臂,选择K种算法可以构建K个摇臂(Arm)。
步骤三:初始化每个摇臂的回报集,回报集Di中存放选择摇臂Armi获得的回报,起初为空集。依次从K个摇臂中选择,基于文本分类数据集训练K个模型Mi,t,i=1,2,...,K,t表示当前时间步,即当前选择摇臂的次数。其中模型Mi,t对文本的分类准确率Xi,t存放到回报集Di中,Xi,t也表示第i个摇臂的回报。
步骤四:基于各个摇臂的回报集D1,D2,,...DK,级联式自动机器学习的上级利用多摇臂赌博机算法从K个摇臂中选择一个,记It表示第t轮迭代被选择的摇臂。具体步骤如下:
(1)根据回报集Di中的所有单次回报Xi,t计算得到Yi,t=Xi,t-α,Zi,t=(Xi,t-α)2,并计算获得:
Figure BDA0003043023710000021
Figure BDA0003043023710000022
其中α>0,是多摇臂赌博机算法的超参。用于平衡增加期望回报所带来的影响。Ti(t)表示直到第t轮迭代Armi被选择的次数。
(2)根据
Figure BDA0003043023710000023
Figure BDA0003043023710000024
计算得到:
Figure BDA0003043023710000025
Figure BDA0003043023710000026
其中θ>0,是多摇臂赌博机算法的超参,表示该算法中Extreme-Region的最大界限。
(3)最终多摇臂赌博机算法在第t轮迭代选择μi(t)和gi(t)总和最大的摇臂:
Figure BDA0003043023710000027
其中β是任意大于0的实数,用于调节μi(t)和gi(t)的重要程度。
步骤五:在步骤四中级联式自动机器学习的上级选择出一个摇臂,记该摇臂由算法Ai构建,算法Ai的超参搜索空间为Hi。下级利用无梯度优化方法为算法Ai从Hi中搜索一组超参数
Figure BDA0003043023710000028
步骤六:算法Ai的超参用
Figure BDA0003043023710000029
赋值,然后在文本分类数据集上训练一个分类模型Mi,t,其中t=K+1,K+2...。将模型Mi,t的文本分类准确率Xi,t存放到回报集Di中。
步骤七:重复步骤四到步骤六,直到迭代次数达到设定的值,返回所有训练的模型中分类准确率最高的模型。该模型用于预测待分类文本的类别。
所述步骤一中,为文本语料数据集中的每条文本语料数据标注类别,生成文本分类数据集。
所述机器学习算法,可以是支持向量机、K近邻、决策树等多种分类算法,可选的算法数量不作限定。并且每个算法包含的超参数量、类型以及超参的取值范围都不一定相同,各算法的超参构成了其超参搜索空间。
与现有技术相比,本发明具有的益处有:
(1)本发明采用自动机器学习技术,可以自主选择适合任务文本环境的分类算法,也可以自动调节算法的超参数,相比于传统的机器学习方法能够大大减少人工调参和选择分类算法的成本。
(2)本发明采用级联式自动机器学习方法,相比于其他机器学习方法,可以降低超参搜索空间的维度,提高搜索效率,且多摇臂赌博机算法能够确保获得泛化性能极佳的分类模型。
附图说明
图1为级联式自动机器学习的整体框架图;
图2为无梯度优化方法流程图;
图3为整个基于级联式自动机器学习文本分类方法的关键步骤流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明针对现实场景中的文本分类,采取自动机器学习技术训练适用于任务文本环境的分类模型,并且自动训练的模型的分类准确率不输于经过专家训练和调参的模型。该方法使用的级联式自动机器学习的整体框架如图1所示,主要分为上下级,上级利用多摇臂赌博机算法自主选择机器学习算法,下级利用无梯度优化方法为所选算法搜索超参数。无梯度优化方法搜索超参数的主要流程如图2所示。重复多次自动选择算法、搜索超参数和训练模型的过程,将其中性能最好的模型用于任务文本的分类。
图3是整个基于级联式自动机器学习文本分类方法的关键步骤流程图。其中:
步骤一:首先要获取带类别标记的文本分类数据集,数据集规模可以是几千条甚至上万条,为其中每条数据标注一个类别,数据的类别数依据任务环境设定。主要包括:
(1)根据任务环境收集标注文本语料数据集,利用jieba分词将文本语料中的每条文本序列切分成由词组成的序列。例如,文本“今天天气很好,我想去爬山。”可以切分成“今天天气很好,我想去爬山。”。
(2)统计所有序列的词频并构建词典,词典中是“词:序号”的对应,并根据所有文本的类别标记构建关于类别标记的词典,该词典中是“类别标记:类别序号”的对应。
(3)将步骤(1)中分好词的文本序列转换成编码序列,并利用文本向量嵌入方法训练的词向量将编码序列转换成向量表示,得到了文本分类数据集;将该数据集分为训练集和验证集,一条文本的向量表示是其所有词的词向量的平均值。
至此获得了用于训练模型的文本分类数据集,记为data。
图1是级联式自动机器学习的流程图,下级是摇臂的内部结构,即无梯度优化方法搜索超参数的整个流程,上级是选择摇臂的策略。
步骤二:实现K种机器学习算法,即构建K个摇臂。由图1摇臂的内部结构可知,一个摇臂包括一种算法,该算法生成的超参数搜索空间和无梯度优化方法。比如K近邻算法,它有n_neighbors、weights和p三种超参,每个超参的取值范围记为δ1,δ2,δ3,则该算法的超参搜索空间H=δ1×δ2×δ3
步骤三:
初始化每个摇臂的回报集D,回报集Di中存放选择Armi获得的回报,起初为空集。依次从K个摇臂中选择,基于文本分类数据集训练K个模型Mi,t,i=1,2,...,K,表t示当前时间步,即当前选择摇臂的次数。其中模型Mi,t对文本的分类准确率Xi,t存放到回报集Di中。
步骤四:
上级基于各个摇臂的回报集,利用多摇臂赌博机算法从多个摇臂中作出选择。主要包括:
(1)根据回报集Di中的所有单次回报Xi,t计算得到Yi,t=Xi,t-α,Zi,t=(Xi,t-α)2,并计算获得:
Figure BDA0003043023710000041
Figure BDA0003043023710000042
其中α>0,是多摇臂赌博机算法的超参。用于平衡增加期望回报所带来的影响。Ti(t)表示直到第t轮迭代Armi被选择的次数。
(2)根据
Figure BDA0003043023710000043
Figure BDA0003043023710000044
计算得到:
Figure BDA0003043023710000045
Figure BDA0003043023710000051
其中θ>0,是多摇臂赌博机算法的超参,表示该算法中Extreme-Region的最大界限。
(3)最终多摇臂赌博机算法在第t轮迭代选择μi(t)和gi(t)总和最大的摇臂:
Figure BDA0003043023710000052
其中β是任意大于0的实数,用于调节μi(t)和gi(t)的重要程度。
步骤五:
记上一步被选择的摇臂由算法Ai构成,利用无梯度优化方法为算法Ai从其超参搜索空间Hi中搜索一组超参数
Figure BDA0003043023710000053
搜索超参数的流程如图2所示,仍以步骤三中的K近邻算法为例,从δ1,δ2,δ3中各自选取一个值ω1,ω2,ω3作为三个超参的值,得到hi=(ω1,ω2,ω3)构成一个样本,共采样m个样本。经过某组超参数配置的算法
Figure BDA0003043023710000054
在文本分类数据集data上训练得到模型,该模型的性能可以衡量该组超参数的好坏。记L为评估模型性能的方法,则通过优化目标函数得到最优的样本即为搜索到的超参数
Figure BDA0003043023710000055
其中目标函数为:
Figure BDA0003043023710000056
步骤六:
将文本分类数据集划分为训练集datatrain和验证集datavalid,用上一步搜索到的超参数
Figure BDA0003043023710000057
为K近邻算法的三个超参赋值,配置好超参数的算法
Figure BDA0003043023710000058
在datatrain上训练一个分类模型Mi,t
Figure BDA0003043023710000059
其中t=K+1,K+2...,该模型在datavalid上分类准确率Xi,t存放到回报集Di中。
步骤七:
重复步骤四到步骤六,直到达到设定的迭代次数,返回所有训练的模型中分类准确率最高的模型。该模型可以用于预测待分类文本的类别。

Claims (7)

1.一种基于自动机器学习算法选择的文本分类方法,其特征在于,分级处理训练文本分类模型过程中的算法选择和超参搜索,上级采取策略选择算法,下级为所选算法搜索超参数;具体来说,利用多摇臂赌博机算法自动的从多个机器学习算法中作出选择,并用无梯度优化方法为所选算法搜索超参数,配置好超参数的算法在文本分类数据集上训练得到分类模型;重复选择算法、搜索超参数和训练模型的过程,可以得到多个不同配置的算法训练的模型,将其中性能最好的模型用于待预测文本;包括以下步骤:
(1)基于任务文本环境收集文本语料数据集,生成文本分类数据集;
(2)挑选K个用于训练分类模型的机器学习算法,并利用每一种算法形成多摇臂赌博机中的一个摇臂,共构建K个摇臂;
(3)初始化每个摇臂的回报集,回报集用于存放各个摇臂获得的回报;
(4)基于每个摇臂的回报集,利用多摇臂赌博机算法从K个摇臂中选择一个摇臂,也就选择了一种算法;
(5)针对被选择的算法,使用无梯度优化方法该算法搜索一组超参数;
(6)步骤(4)中被选择算法的超参用步骤(5)中搜索到的一组超参数赋值,然后在文本分类数据集上训练模型,并评估该模型的分类准确率;
(7)用该模型的分类准确率更新步骤(4)中被选择的摇臂的回报集;
(8)重复执行步骤(4)到步骤(7),直到达到设定的迭代次数,返回所有被训练的模型中分类准确率最高的模型,用于对待预测的文本数据进行分类。
2.根据权利要求1所述的基于自动机器学习算法选择的文本分类方法,其特征在于,基于任务文本环境收集文本语料数据集,为其中每条数据标注一个类别;根据所有的类别建立一个字典,字典中的每个元素是“类别:序号”的对应,根据语料数据集的词频也建立一个词典,词典中的每个元素是“词:序号”的对应;然后根据词典将数据集中的每条文本序列转换成编码表示,并利用文本向量嵌入方法训练的词向量将编码序列转换成向量表示,得到了文本分类数据集;将该数据集分为训练集和验证集。
3.根据权利要求1所述的基于自动机器学习算法选择的文本分类方法,其特征在于,所述步骤(2)中的机器学习算法,包括支持向量机、K近邻和决策树分类算法;各算法的超参构成了其超参搜索空间。
4.根据权利要求1所述的基于自动机器学习算法选择的文本分类方法,其特征在于,所述算法选择过程中,初始化每个摇臂的回报集,回报集Di中存放选择摇臂Armi获得的回报,起初为空集;依次从K个摇臂中选择,基于文本分类数据集训练K个模型Mi,t,i=1,2,...,K,t表示当前时间步,即当前选择摇臂的次数;其中模型Mi,t对文本的分类准确率Xi,t存放到回报集Di中,Xi,t也表示第i个摇臂的回报。
5.根据权利要求1所述的基于自动机器学习算法选择的文本分类方法,其特征在于,所述步骤(4)中:基于各个摇臂的回报集D1,D2,,...DK,级联式自动机器学习的上级利用多摇臂赌博机算法从K个摇臂中选择一个,记It表示第t轮迭代被选择的摇臂;具体步骤如下:
(1)根据回报集Di中的所有单次回报Xi,t计算得到Yi,t=Xi,t-α,Zi,t=(Xi,t-α)2,并计算获得:
Figure FDA0003043023700000021
Figure FDA0003043023700000022
其中α>0,是多摇臂赌博机算法的超参,用于平衡增加期望平均回报所带来的影响;Ti(t)表示直到第t轮迭代Armi被选择的次数;
(2)根据
Figure FDA0003043023700000023
Figure FDA0003043023700000024
计算得到:
Figure FDA0003043023700000025
Figure FDA0003043023700000026
其中θ>0,是多摇臂赌博机算法的超参,表示该算法中Extreme-Region的最大界限。
(3)最终多摇臂赌博机算法在第t轮迭代选择μi(t)和gi(t)总和最大的摇臂:
Figure FDA0003043023700000027
其中β是任意大于0的实数,用于调节μi(t)和gi(t)的重要程度。
6.根据权利要求1所述的基于自动机器学习算法选择的文本分类方法,其特征在于,所述步骤(5)中:在级联式自动机器学习的上级选择出一个摇臂,记该摇臂由算法Ai构建,算法Ai的超参搜索空间为Hi;下级利用无梯度优化方法为算法Ai从Hi中搜索一组超参数
Figure FDA0003043023700000028
7.根据权利要求6所述的基于自动机器学习算法选择的文本分类方法,其特征在于,所述步骤(6)-(7)中,算法Ai的超参用
Figure FDA0003043023700000029
赋值,然后在文本分类数据集上训练一个分类模型Mi,t,将模型Mi,t的文本分类准确率Xi,t存放到回报集Di中。
CN202110465097.3A 2021-04-28 2021-04-28 一种基于自动机器学习算法选择的文本分类方法 Active CN113282747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110465097.3A CN113282747B (zh) 2021-04-28 2021-04-28 一种基于自动机器学习算法选择的文本分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110465097.3A CN113282747B (zh) 2021-04-28 2021-04-28 一种基于自动机器学习算法选择的文本分类方法

Publications (2)

Publication Number Publication Date
CN113282747A true CN113282747A (zh) 2021-08-20
CN113282747B CN113282747B (zh) 2023-07-18

Family

ID=77277522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110465097.3A Active CN113282747B (zh) 2021-04-28 2021-04-28 一种基于自动机器学习算法选择的文本分类方法

Country Status (1)

Country Link
CN (1) CN113282747B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114003393A (zh) * 2021-12-30 2022-02-01 南京大学 一种提高集成型自动机器学习运行性能的方法和系统
CN115186769A (zh) * 2022-09-07 2022-10-14 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于nlp的突变基因分类方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298032A (zh) * 2019-05-29 2019-10-01 西南电子技术研究所(中国电子科技集团公司第十研究所) 文本分类语料标注训练系统
CN111447471A (zh) * 2020-03-26 2020-07-24 广州市百果园信息技术有限公司 模型生成方法、播放控制方法、装置、设备及存储介质
CN112256739A (zh) * 2020-11-12 2021-01-22 同济大学 一种基于多臂赌博机的动态流大数据中数据项筛选方法
CN112733004A (zh) * 2021-01-22 2021-04-30 上海交通大学 一种基于多臂老虎机算法的影视作品推荐方法
CN113011559A (zh) * 2021-02-24 2021-06-22 中国科学院空天信息创新研究院 基于kubernetes的自动机器学习方法及系统
CN114066014A (zh) * 2021-10-22 2022-02-18 哈尔滨工业大学 基于异步并行多臂老虎机的机器学习的时间序列预测方法
CN114328244A (zh) * 2021-12-30 2022-04-12 杭州电子科技大学 一种基于多臂赌博机算法的模糊测试器调度方法
WO2023040145A1 (zh) * 2021-09-17 2023-03-23 平安科技(深圳)有限公司 基于人工智能的文本分类方法、装置、电子设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298032A (zh) * 2019-05-29 2019-10-01 西南电子技术研究所(中国电子科技集团公司第十研究所) 文本分类语料标注训练系统
CN111447471A (zh) * 2020-03-26 2020-07-24 广州市百果园信息技术有限公司 模型生成方法、播放控制方法、装置、设备及存储介质
CN112256739A (zh) * 2020-11-12 2021-01-22 同济大学 一种基于多臂赌博机的动态流大数据中数据项筛选方法
CN112733004A (zh) * 2021-01-22 2021-04-30 上海交通大学 一种基于多臂老虎机算法的影视作品推荐方法
CN113011559A (zh) * 2021-02-24 2021-06-22 中国科学院空天信息创新研究院 基于kubernetes的自动机器学习方法及系统
WO2023040145A1 (zh) * 2021-09-17 2023-03-23 平安科技(深圳)有限公司 基于人工智能的文本分类方法、装置、电子设备及介质
CN114066014A (zh) * 2021-10-22 2022-02-18 哈尔滨工业大学 基于异步并行多臂老虎机的机器学习的时间序列预测方法
CN114328244A (zh) * 2021-12-30 2022-04-12 杭州电子科技大学 一种基于多臂赌博机算法的模糊测试器调度方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YI-QI HU等: "Cascaded algorithm-selection and hyper-parameter optimization with extreme-region upper confidence bound bandit", 《《PROCEEDINGS OF THE 28TH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE (IJCAF19) 》, pages 2528 - 2534 *
刘郭庆等: "基于三元多臂赌博机的树结构最优动作识别基于三元多臂赌博机的树结构最优动作识别", 《计算机应用》, pages 2252 - 2260 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114003393A (zh) * 2021-12-30 2022-02-01 南京大学 一种提高集成型自动机器学习运行性能的方法和系统
CN114003393B (zh) * 2021-12-30 2022-06-14 南京大学 一种提高集成型自动机器学习运行性能的方法和系统
CN115186769A (zh) * 2022-09-07 2022-10-14 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于nlp的突变基因分类方法
CN115186769B (zh) * 2022-09-07 2022-11-25 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于nlp的突变基因分类方法

Also Published As

Publication number Publication date
CN113282747B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN107992976B (zh) 热点话题早期发展趋势预测系统及预测方法
CN111898689A (zh) 一种基于神经网络架构搜索的图像分类方法
CN113282747A (zh) 一种基于自动机器学习算法选择的文本分类方法
CN110674965A (zh) 基于动态特征选取的多时间步长风功率预测方法
CN117236278B (zh) 一种基于数字孪生技术的芯片生产仿真方法及系统
CN111598329A (zh) 基于自动化参数调整循环神经网络的时序数据预测方法
CN114004153A (zh) 一种基于多源数据融合的侵彻深度预测方法
CN114792126A (zh) 一种基于遗传算法的卷积神经网络设计方法
CN111507472A (zh) 一种基于重要性剪枝的精度估计参数搜索方法
CN116646929A (zh) 一种基于pso-cnn-bilstm的短期风电功率预测方法
CN114241267A (zh) 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法
CN113920514A (zh) 一种面向目标检测的高效进化神经网络架构搜索方法
CN116245259B (zh) 基于深度特征选择的光伏发电预测方法、装置和电子设备
CN112651499A (zh) 一种基于蚁群优化算法和层间信息的结构化模型剪枝方法
CN116611504A (zh) 一种基于进化的神经架构搜索方法
CN117290673A (zh) 一种基于多模型融合的船舶能耗高精度预测系统
CN115620046A (zh) 一种基于半监督性能预测器的多目标神经架构搜索方法
CN115661546A (zh) 一种特征选择与分类器联合设计的多目标优化分类方法
CN114254199A (zh) 基于二分图投影和node2vec的课程推荐方法
CN112686366A (zh) 一种基于随机搜索和卷积神经网络的轴承故障诊断方法
CN113139624A (zh) 基于机器学习的网络用户分类方法
Zhang et al. Bandit neural architecture search based on performance evaluation for operation selection
CN111639797A (zh) 基于Gumbel-softmax技术的组合优化方法
Ali et al. Recent Trends in Neural Architecture Search Systems
Li et al. Surrogate-Assisted Evolution of Convolutional Neural Networks by Collaboratively Optimizing the Basic Blocks and Topologies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant