CN110533180A - 网络结构搜索方法和装置、可读存储介质、电子设备 - Google Patents
网络结构搜索方法和装置、可读存储介质、电子设备 Download PDFInfo
- Publication number
- CN110533180A CN110533180A CN201910637580.8A CN201910637580A CN110533180A CN 110533180 A CN110533180 A CN 110533180A CN 201910637580 A CN201910637580 A CN 201910637580A CN 110533180 A CN110533180 A CN 110533180A
- Authority
- CN
- China
- Prior art keywords
- network
- task
- parameter
- structural parameters
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开实施例公开了一种网络结构搜索方法和装置、可读存储介质、电子设备,其中,方法包括:确定与第一任务对应的第一网络;根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;基于所述第二网络确定与所述第二任务对应的第三网络,本公开实施例利用第一网络的结构和参数作为先验知识,通过对第一网络进行预训练,然后将参数迁移到第二网络的搜索中,由于进行了预训练,获得了第二网络作为网络主体部分,在第二网络的基础上搜索获得第三网络,可以大幅减少搜索时间,提高搜索精度。
Description
技术领域
本公开涉及神经网络技术,尤其是一种网络结构搜索方法和装置、可读存储介质、电子设备。
背景技术
现有的网络结构搜索方法主要包括四种方法:强化学习,进化算法。强化学习和进化算法是先生成一种网络结构,训练得到网络结构然后获得该网络结构的性能指标,根据这次经验去生成更好的网络结构。
现有的网络结构搜索方法都是从零开始构建搜索网络空间,搜索速度慢。
发明内容
为了解决上述搜索速度慢的技术问题,提出了本公开。本公开的实施例提供了一种网络结构搜索方法和装置、可读存储介质、电子设备。
根据本公开实施例的一个方面,提供了一种网络结构搜索方法,包括:
确定与第一任务对应的第一网络;
根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;
基于所述第二网络确定与所述第二任务对应的第三网络。
根据本公开实施例的另一方面,提供了一种网络结构搜索装置,包括:
第一网络确定模块,用于确定与第一任务对应的第一网络;
第二网络确定模块,用于根据所述第一网络确定模块确定的第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;
第三网络确定模块,用于基于所述第二网络确定模块确定的第二网络确定与所述第二任务对应的第三网络。
根据本公开实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述实施例所述的网络结构搜索方法。
根据本公开实施例的还一方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述实施例所述的网络结构搜索方法。
基于本公开上述实施例提供的一种网络结构搜索方法和装置、可读存储介质、电子设备,确定与第一任务对应的第一网络;根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;基于所述第二网络确定与所述第二任务对应的第三网络,本公开实施例利用第一网络的结构和参数作为先验知识,通过对第一网络进行预训练,然后将参数迁移到第二网络的搜索中,由于进行了预训练,获得了第二网络作为网络主体部分,在第二网络的基础上搜索获得第三网络,可以大幅减少搜索时间,提高搜索精度。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开提供的网络结构搜索方法的结构示意图。
图2a是图1提供的实施例中步骤101中第一超级网络的一个结构示意图。
图2b是图1提供的实施例中步骤102中第二超级网络的一个结构示意图。
图2c是图1提供的实施例中步骤103中选出的最优的子结构的一个结构示意图。
图3演示了基于梯度获得最优子结构的一个结构示意图。
图4是本公开一示例性实施例提供的网络结构搜索方法的流程示意图。
图5是本公开另一示例性实施例提供的网络结构搜索方法的流程示意图。
图6是本公开图5所示的实施例中步骤404的一个流程示意图。
图7是本公开又一示例性实施例提供的网络结构搜索方法的流程示意图。
图8是本公开图7所示的实施例中步骤406的一个流程示意图。
图9是本公开一示例性实施例提供的网络结构搜索装置的结构示意图。
图10是本公开另一示例性实施例提供的网络结构搜索装置的结构示意图。
图11是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
申请概述
在实现本公开的过程中,发明人发现,现有的网络结构搜索方法都是从零开始构建搜索空间,但该方法至少存在以下问题:搜索速度非常慢,需要耗费很多的资源。
示例性系统
图1是本公开提供的网络结构搜索方法的结构示意图。如图1所示,使用基于梯度的方法,步骤101,基于一个第一任务建立一个第一超级网络(supernet),该第一任务一般是分类任务,因为语义分割任务和物体检测任务很依赖于模型的预训练,没有预训练的话可能训练不收敛或训练收敛速度非常慢,所以在这里用分类任务做一个预训练。这个搜索过程就是使用基于梯度的方法(已经有的方法,可以参考DARTS);基于该第一任务对应的数据集对第一超级网络进行搜索(等同于对网络的训练),对第一超级网络搜索到一定程度(训练完成)后,获得第一超级网络的网络参数和结构参数,其中,网络参数为每个网络层中的参数,例如:卷积层中的卷积核等;结构参数可以包括超级网络中每两层结构之间的多个连接权重等。图2a是图1提供的实施例中步骤101中第一超级网络的一个结构示意图。如图2a所示,第一超级网络中的每层结构都包括至少一个网络层,图2a中的每个圆表示一个网络层,箭头表示两个网络层之间的连接,图2a中包括的多个圆表示相同或不同类型的网络层(如,卷积层、全连接层等)。
步骤102,将第一超级网络训练后的网络参数和结构参数迁移到第二任务(例如,密集预测任务)对应的第二超级网络中,并基于第二任务对应的数据集对该第二超级网络进行搜索,对第二超级网络搜索到一定程度后,确定第二超级网络中的网络参数和结构参数。图2b是图1提供的实施例中步骤102中第二超级网络的一个结构示意图。如图2b所示,第二超级网络与第一超级网络的结构相似,与图2a类似,图2b中的每个圆表示一个网络层,箭头表示两个网络层之间的连接,图2b中包括的多个圆表示相同或不同类型的网络层(如,卷积层、全连接层等),由于对应的任务不同,会有部分网络层的结构有一些差异,对于相同的网络结构部分,第二超级网络可直接采用第一超级网络中的网络参数,对于不同于第一超级网络的部分,可随机初始化其中的网络参数。
步骤103,最后根据第二超级网络的结构参数从第二超级网络中选出最优的子结构。其中,结构参数是基于梯度的方法里面的一种参数,是分配在每个操作上的权重,当搜索结束时就选择权重最大的操作来构成子图。图2c是图1提供的实施例中步骤103中选出的最优的子结构的一个结构示意图。第二超级网络中包括多个子网络,如图2c所示,该最优的子结构是基于结构参数(权重)从第二超级网络中选择的一个子网络,与图2a和图2b类似,图2c中的每个圆同样表示一个网络层,箭头表示两个网络层之间的连接,图2c中包括的多个圆表示相同或不同类型的网络层(如,卷积层、全连接层等)。
图3演示了基于梯度获得最优子结构的一个结构示意图。如图3所示,一个父网络(如,图1实施例中提供的第二超级网络)里面包括所有的子网络,该父网络中包括0、1、2、3四个部分,其中间部分与图2b所示的中间层类似,分别具有多个网络层,因此,每两个部分之间包括多种连接,每个连接对应一个连接权重,每个子网络都有相应的连接权重(结构参数),在训练的过程中连接权重会根据梯度来改变,训练结束后会有连接权重最大的子网络,最后测试只留下连接权重最大的子网络,就是最优子网络。
示例性方法
图4是本公开一示例性实施例提供的网络结构搜索方法的流程示意图。本实施例可应用在电子设备上,如图4所示,包括如下步骤:
步骤402,确定与第一任务对应的第一网络。
其中,第一任务可以是分类任务等,本公开实施例不限制具体第一任务的种类。可选地,第一网络为超级网络(supernet),即第一网络的每层结构中包括多个网络层,例如,第一网络的结构可以如图2a所示。
步骤404,根据第一网络和一个第二任务确定与第二任务对应的第二网络,得到一个第二网络。
在一实施例中,第二任务可以为分割、检测等任务,获得的第二网络对应一个第二任务,可选地,第二网络为超级网络(supernet),例如,第二网络的结构可以如图2b所示。
步骤406,基于第二网络确定与第二任务对应的第三网络。
例如,第三网络是第二网络中的一个子网络,可选地,由于第二网络是超级网络,其中包括多个子网络,本实施例为了将获得的第三网络可以应用到第二任务中,需要从第二网络的多个子网络中选择一个子网络作为第三网络,例如,第三网络的结构可以如图2c所示。
本公开上述实施例提供的网络结构搜索方法,确定与第一任务对应的第一网络;根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;基于所述第二网络确定与所述第二任务对应的第三网络,本公开实施例利用第一网络的网络结构、网络参数和结构参数作为先验知识,通过对第一网络进行预训练,然后将参数迁移到第二网络的搜索中,由于对第一网络进行了预训练,因此可获得第二网络作为网络主体部分,进而在第二网络的基础上搜索获得第三网络,可以大幅减少搜索时间,提高搜索精度。
图5是本公开另一示例性实施例提供的网络结构搜索方法的流程示意图。如图5所示,包括如下步骤:
步骤402,确定与第一任务对应的第一网络。
步骤403,利用第一任务对应的训练数据集样本对第一网络进行训练,得到第一网络的网络参数和结构参数。
可选地,对于第一网络的训练,可参照图1所示实施例中步骤101中对第一超级网络的训练,例如,基于梯度的方式实现对第一网络的训练,以获得第一网络的网络参数和结构参数。
步骤404,根据第一网络和一个第二任务确定与第二任务对应的第二网络,得到一个第二网络。
步骤406,基于第二网络确定与第二任务对应的第三网络。
可选地,基于第二网络确定与第二任务对应的第三网络的过程可参照图3提供的实施例,通过结构参数从第二网络的多个子结构中选择权重最大的子结构作为第三网络。
由于第一网络在训练之前,只具有已知的对应第一任务的第一网络的网络结构,其中的网络参数和结构参数可能是随机初始化的或者其他方式获得的,为了提高基于第一网络获得的第二网络的性能,本实施例在基于第一网络确定第二网络之前,对第一网络进行训练,以训练后的第一网络的网络参数和结构参数作为第二网络的先验知识,使第二网络的初始参数更合理,可以大幅减少第二网络的搜索时间。
如图6所示,在上述图5所示实施例的基础上,步骤404可包括如下步骤:
步骤4041,根据第二任务确定第二网络的网络结构。
可选地,第二网络对应第二任务,第二网络与第一网络的结构相似,仅在部分细节,如:卷积核大小等由于对应的任务不同而有差别。
步骤4042,基于第一网络的网络参数和结构参数对网络结构的参数进行赋值,获得第二网络。
可选地,对网络结构的参数进行赋值的过程可参照图1所示实施例中步骤102提供的将第一网络训练后的网络参数和结构参数迁移到第二网络中,实现对第二网络中网络参数和结构参数的初始化,但是,由于第一网络与第二网络的结构会存在一些细节差异,会导致第二网络的部分结构与第一网络无法匹配,此时,可以随机初始化第二网络中无法与第一网络匹配的网络结构中的网络参数和结构参数,避免了第二网络中的由于网络参数和结构参数不确定而导致的无法训练的问题,确保了第二网络中的网络参数和结构参数都具有初始值,通过本实施例的赋值使第二网络的参数的初始值更合理,缩短了第二网络的训练时间。
图7是本公开又一示例性实施例提供的网络结构搜索方法的流程示意图。如图7所示,包括如下步骤:
步骤402,确定与第一任务对应的第一网络。
步骤404,根据第一网络和一个第二任务确定与第二任务对应的第二网络,得到一个第二网络。
步骤405,利用第二任务对应的训练数据集样本对第二网络进行训练,调整第二网络中的网络参数和结构参数;获得训练后的网络参数和结构参数。
可选的,该步骤可参照图1所示的实施例中的步骤102中,在获得第二网络之后,基于第二任务(例如,分割、检测等任务)对应的数据集对第二网络进行训练,以获得更合理的网络参数和结构参数。
步骤406,基于第二网络确定与第二任务对应的第三网络。
在一些可选的实施例中,步骤406可以包括:利用训练后的结构参数选择第二网络包括的至少两个子网络中的一个子网络作为对应第二任务的第三网络。
可选地,获得第三网络的过程可参照图3提供的实施例,通过结构参数从第二网络的多个子结构中选择权重最大的子结构作为第三网络。
本实施例中,在参数迁移之后获得的第二网络需要针对第二任务进行训练,以适应第二任务,为获得第三网络提供结构参数,并以该训练后的结构参数确定第三网络的网络结构和网络参数,从而可以使通过训练的第二网络更适合第二任务,进而基于训练后的第二网络获得的第三网络也更适合第二任务,本实施例通过对第二网络的训练提高了获得的第三网络的准确性。
如图8所示,在上述图7所示实施例的基础上,可选地,结构参数包括第二网络中每两个网络层之间的连接权重;步骤406可包括如下步骤:
步骤4061,基于第二网络中每两层结构之间的多个连接权重中的最大连接权重确定两层结构之间的一个连接,获得每两层结构之间仅有一个连接的中间结构。
步骤4062,基于第二网络的网络参数对中间结构进行网络参数赋值,确定第三网络。
可选地,图3演示了基于梯度获得最优子结构的一个结构示意图,本实施例中第二网络经过训练获得的结构参数包括每两层结构之间的多个连接权重,通过每两层结构之间的多个连接权重的大小关系,可以确定这两层之间的唯一连接(权重最大的连接),此时可获得一个所有连接权重都最大的子网络(其中,每两层之间的连接权重都是多个连接权重中最大的),即,该子网络的权重最大,以该子网络作为中间结构,并将该子网络的网络参数迁移到中间结构即可获得第三网络。
在一些可选的实施例中,本公开实施例提供的方法,还包括:
利用第二任务对应的训练数据集样本对第三网络进行训练,调整第三网络中的网络参数,获得训练后的第三网络。
其中,训练第二网络和训练第三网络的数据集可以相同或不同,或存在部分重合,本公开实施例不限制具体数据集的数量和内容。
针对选择得到的第三网络继续针对第二任务对应的训练数据集进行训练,可以提高第三网络的任务性能,使训练后的第三网络更适合应用于第二任务。
本公开实施例提供的任一种网络结构搜索方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种网络结构搜索方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种网络结构搜索方法。下文不再赘述。
示例性装置
图9是本公开一示例性实施例提供的网络结构搜索装置的结构示意图。如图9所示,本实施例包括:
第一网络确定模块91,用于确定与第一任务对应的第一网络。
第二网络确定模块92,用于根据第一网络确定模块91确定的第一网络和一个第二任务确定与第二任务对应的第二网络,得到一个第二网络。
第三网络确定模块93,用于基于第二网络确定模块92确定的第二网络确定与第二任务对应的第三网络。
本公开上述实施例提供的网络结构搜索装置,确定与第一任务对应的第一网络;根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;基于所述第二网络确定与所述第二任务对应的第三网络,本公开实施例利用第一网络的结构和参数作为先验知识,通过对第一网络进行预训练,然后将参数迁移到第二网络的搜索中,由于进行了预训练,获得了第二网络作为网络主体部分,在第二网络的基础上搜索获得第三网络,可以大幅减少搜索时间,提高搜索精度。
图10是本公开另一示例性实施例提供的网络结构搜索装置的结构示意图。如图10所示,本实施例中,第一网络确定模块91与第二网络确定模块92之间还包括:
第一训练模块11,用于利用第一任务对应的训练数据集样本对第一网络进行训练,得到第一网络的网络参数和结构参数。
本实施例中,第二网络确定模块92,包括:
第一结构确定单元921,用于根据第二任务确定第二网络的网络结构。
第一参数赋值单元922,用于基于第一网络的网络参数和结构参数对网络结构的参数进行赋值,获得第二网络。
第二网络确定模块92和第三网络确定模块93之间还包括:
第二训练模块12,用于利用第二任务对应的训练数据集样本对第二网络进行训练,调整第二网络中的网络参数和结构参数;获得训练后的网络参数和结构参数。
可选地,第三网络确定模块93具体用于利用训练后的结构参数选择第二网络包括的至少两个子网络中的一个子网络作为对应第二任务的第三网络。
其中,结构参数包括第二网络中每两个网络层之间的连接权重;
此时,第三网络确定模块93,包括:
第二结构确定单元931,用于基于所述第二网络中每两层结构之间的多个连接权重中的最大连接权重确定所述两层结构之间的一个连接,获得每两层结构之间仅有一个连接的中间结构;
第二参数赋值单元932,用于基于第二网络的网络参数对中间结构进行网络参数赋值,确定第三网络。
本实施例装置还包括:
第三训练模块13,用于利用第二任务对应的训练数据集样本对第三网络进行训练,调整第三网络中的网络参数,获得训练后的第三网络。
示例性电子设备
下面,参考图11来描述根据本公开实施例的电子设备。该电子设备可以是第一设备100和第二设备200中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
图11图示了根据本公开实施例的电子设备的框图。
如图11所示,电子设备110包括一个或多个处理器111和存储器112。
处理器111可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备110中的其他组件以执行期望的功能。
存储器112可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器111可以运行所述程序指令,以实现上文所述的本公开的各个实施例的网络结构搜索方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备110还可以包括:输入装置113和输出装置114,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,在该电子设备是第一设备100或第二设备200时,该输入装置113可以是上述的麦克风或麦克风阵列,用于捕捉声源的输入信号。在该电子设备是单机设备时,该输入装置113可以是通信网络连接器,用于从第一设备100和第二设备200接收所采集的输入信号。
此外,该输入设备113还可以包括例如键盘、鼠标等等。
该输出装置114可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出设备114可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图11中仅示出了该电子设备11中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备110还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的网络结构搜索方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的网络结构搜索方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种网络结构搜索方法,包括:
确定与第一任务对应的第一网络;
根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;
基于所述第二网络确定与所述第二任务对应的第三网络。
2.根据权利要求1所述的方法,在根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络之前,还包括:
利用所述第一任务对应的训练数据集样本对所述第一网络进行训练,得到所述第一网络的网络参数和结构参数。
3.根据权利要求2所述的方法,其中,所述根据所述第一网络和一个第二任务确定与所述第二任务对应的第二网络,包括:
根据所述第二任务确定第二网络的网络结构;
基于所述第一网络的网络参数和结构参数对所述网络结构的参数进行赋值,获得所述第二网络。
4.根据权利要求1所述的方法,在基于所述第二网络确定与所述第二任务对应的第三网络之前,还包括:
利用所述第二任务对应的训练数据集样本对所述第二网络进行训练,调整所述第二网络中的网络参数和结构参数;
获得训练后的网络参数和结构参数。
5.根据权利要求4所述的方法,其中,所述基于所述第二网络确定与所述第二任务对应的第三网络,包括:
利用所述训练后的结构参数选择所述第二网络包括的至少两个子网络中的一个子网络作为对应所述第二任务的第三网络。
6.根据权利要求5所述的方法,其中,所述结构参数包括所述第二网络中每两个网络层之间的连接权重;
所述利用所述训练后的结构参数选择所述第二网络包括的至少两个子网络中的一个子网络作为对应所述第二任务的第三网络,包括:
基于所述第二网络中每两层结构之间的多个连接权重中的最大连接权重确定所述两层结构之间的一个连接,获得每两层结构之间仅有一个连接的中间结构;
基于所述第二网络的网络参数对所述中间结构进行网络参数赋值,确定所述第三网络。
7.根据权利要求1-6所述的方法,还包括:
利用所述第二任务对应的训练数据集样本对所述第三网络进行训练,调整所述第三网络中的网络参数,获得训练后的第三网络。
8.一种网络结构搜索装置,包括:
第一网络确定模块,用于确定与第一任务对应的第一网络;
第二网络确定模块,用于根据所述第一网络确定模块确定的第一网络和一个第二任务确定与所述第二任务对应的第二网络,得到一个第二网络;
第三网络确定模块,用于基于所述第二网络确定模块确定的第二网络确定与所述第二任务对应的第三网络。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的网络结构搜索方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7任一所述的网络结构搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910637580.8A CN110533180A (zh) | 2019-07-15 | 2019-07-15 | 网络结构搜索方法和装置、可读存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910637580.8A CN110533180A (zh) | 2019-07-15 | 2019-07-15 | 网络结构搜索方法和装置、可读存储介质、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110533180A true CN110533180A (zh) | 2019-12-03 |
Family
ID=68660323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910637580.8A Pending CN110533180A (zh) | 2019-07-15 | 2019-07-15 | 网络结构搜索方法和装置、可读存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110533180A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021164751A1 (zh) * | 2020-02-21 | 2021-08-26 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
WO2021218517A1 (zh) * | 2020-04-29 | 2021-11-04 | 华为技术有限公司 | 获取神经网络模型的方法、图像处理方法及装置 |
CN115049108A (zh) * | 2022-05-20 | 2022-09-13 | 支付宝(杭州)信息技术有限公司 | 多任务模型训练方法、多任务预测方法、相关装置及介质 |
-
2019
- 2019-07-15 CN CN201910637580.8A patent/CN110533180A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021164751A1 (zh) * | 2020-02-21 | 2021-08-26 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
WO2021218517A1 (zh) * | 2020-04-29 | 2021-11-04 | 华为技术有限公司 | 获取神经网络模型的方法、图像处理方法及装置 |
CN115049108A (zh) * | 2022-05-20 | 2022-09-13 | 支付宝(杭州)信息技术有限公司 | 多任务模型训练方法、多任务预测方法、相关装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3369045B1 (en) | Determining orders of execution of a neural network | |
CN105224606B (zh) | 一种用户标识的处理方法及装置 | |
CN104486461B (zh) | 域名分类方法和装置、域名识别方法和系统 | |
CN110533180A (zh) | 网络结构搜索方法和装置、可读存储介质、电子设备 | |
CN111814966A (zh) | 神经网络架构搜索方法、神经网络应用方法、设备及存储介质 | |
CN111667057B (zh) | 用于搜索模型结构的方法和装置 | |
CN110956202B (zh) | 基于分布式学习的图像训练方法、系统、介质及智能设备 | |
US11651233B2 (en) | Candidate visualization techniques for use with genetic algorithms | |
CN111582454B (zh) | 生成神经网络模型的方法和装置 | |
CN107273412B (zh) | 一种文本数据的聚类方法、装置和系统 | |
CN104348919B (zh) | 进行文件下载的方法、装置和浏览器 | |
CN111582453A (zh) | 生成神经网络模型的方法和装置 | |
CN109272109A (zh) | 神经网络模型的指令调度方法及装置 | |
CN111105006A (zh) | 一种深度学习网络训练系统及方法 | |
CN105607944B (zh) | 一种共享应用环境的方法及装置 | |
WO2021130596A1 (en) | Elastic execution of machine learning workloads using application based profiling | |
CN114416260B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111582477A (zh) | 神经网络模型的训练方法和装置 | |
CN109923515A (zh) | 使用网络可寻址设备创建电影化的讲故事体验 | |
JP2021192286A (ja) | モデル訓練、画像処理方法及びデバイス、記憶媒体、プログラム製品 | |
CN109992269A (zh) | 一种运维平台的开发方法及装置 | |
CN110069997B (zh) | 场景分类方法、装置及电子设备 | |
CN110413808A (zh) | 一种三维点云数据存储、查询方法及装置 | |
US10776411B2 (en) | Systematic browsing of automated conversation exchange program knowledge bases | |
CN104580109A (zh) | 生成点选验证码的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191203 |
|
RJ01 | Rejection of invention patent application after publication |