CN111582480A - 用于对模型剪枝的方法和装置 - Google Patents
用于对模型剪枝的方法和装置 Download PDFInfo
- Publication number
- CN111582480A CN111582480A CN202010388363.2A CN202010388363A CN111582480A CN 111582480 A CN111582480 A CN 111582480A CN 202010388363 A CN202010388363 A CN 202010388363A CN 111582480 A CN111582480 A CN 111582480A
- Authority
- CN
- China
- Prior art keywords
- pruning
- processing layer
- component
- target model
- search space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013138 pruning Methods 0.000 title claims abstract description 277
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims description 85
- 238000004590 computer program Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 5
- 230000008878 coupling Effects 0.000 abstract description 3
- 238000010168 coupling process Methods 0.000 abstract description 3
- 238000005859 coupling reaction Methods 0.000 abstract description 3
- 230000015654 memory Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了用于对模型剪枝的方法和装置,涉及计算机视觉技术领域。具体实施方式包括:获取目标模型的训练脚本,以及与该目标模型的剪枝相关联的剪枝相关参数,其中,该剪枝相关参数包括剪枝率;确定包含该剪枝相关参数的多个候选值的搜索空间;将该训练脚本作为第一组件,并调用该第一组件,在该搜索空间中搜索该剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。本申请可以将训练脚本进行组件化,从而在不修改训练脚本的内容的情况下,实现自动化搜索剪枝相关数据的目标值,避免了在训练脚本中硬编码剪枝脚本带来的高耦合度,同时提高了对模型进行剪枝的灵活性。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及计算机视觉技术领域,尤其涉及用于对模型剪枝的方法和装置。
背景技术
深度神经网络的运行往往需要占用大量内存,消耗一定的计算资源。当需要执行实时推断、在运行模型、在计算资源有限的情况下运行时,内存等计算资源就是运行的瓶颈。
为了提高模型的计算速度,减少内存和计算资源的占用,可以对模型进行剪枝(Pruning)来实现减少网络的复杂性和避免过度拟合。采用模型剪枝的方式可以高效生成规模更小、内存利用率更高、能耗更低、推断速度更快、推断准确率损失更小的模型。
发明内容
提供了一种用于对模型剪枝的方法、装置、电子设备以及存储介质。
根据第一方面,提供了一种用于对模型剪枝的方法,包括:获取目标模型的训练脚本,以及与目标模型的剪枝相关联的剪枝相关参数,其中,剪枝相关参数包括剪枝率;确定包含剪枝相关参数的多个候选值的搜索空间;将训练脚本作为第一组件,并调用第一组件,在搜索空间中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
根据第二方面,提供了一种用于对模型剪枝的装置,包括:第一获取单元,被配置成获取目标模型的训练脚本,以及与目标模型的剪枝相关联的剪枝相关参数,其中,剪枝相关参数包括剪枝率;确定单元,被配置成确定包含剪枝相关参数的多个候选值的搜索空间;调用单元,被配置成将训练脚本作为第一组件,并调用第一组件,在搜索空间中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
根据第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如用于对模型剪枝的方法中任一实施例的方法。
根据第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如用于对模型剪枝的方法中任一实施例的方法。
根据本申请的方案,可以将训练脚本进行组件化,从而在不修改训练脚本的内容的情况下,实现自动化搜索剪枝相关数据的目标值,避免了在训练脚本中硬编码剪枝脚本带来的高耦合度,同时提高了对模型进行剪枝的灵活性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请一些实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的用于对模型剪枝的方法的一个实施例的流程图;
图3是根据本申请的用于对模型剪枝的方法的一个应用场景的示意图;
图4是根据本申请的用于对模型剪枝的方法的又一个实施例的流程图;
图5是根据本申请的用于对模型剪枝的装置的一个实施例的结构示意图;
图6是用来实现本申请实施例的用于对模型剪枝的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于对模型剪枝的方法或用于对模型剪枝的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。
这里的终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对接收到的训练脚本等数据进行分析等处理,并将处理结果(例如用于对目标模型进行剪枝的目标值)反馈给终端设备。
需要说明的是,本申请实施例所提供的用于对模型剪枝的方法可以由服务器105或者终端设备101、102、103执行,相应地,用于对模型剪枝的装置可以设置于服务器105或者终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于对模型剪枝的方法的一个实施例的流程200。该用于对模型剪枝的方法,包括以下步骤:
步骤201,获取目标模型的训练脚本,以及与目标模型的剪枝相关联的剪枝相关参数,其中,剪枝相关参数包括剪枝率。
在本实施例中,用于对模型剪枝的方法运行于其上的执行主体(例如图1所示的服务器或终端设备)可以获取目标模型的训练脚本,并获取与该目标模型的剪枝有关的剪枝相关参数。具体地,脚本也即代码,训练脚本可以包括对目标模型训练所需的各种信息,比如损失函数,也即损失函数对应的代码(即损失函数的脚本),此外,还可以包括目标模型,也即目标模型对应的代码(即目标模型的脚本)。在实践中,目标模型可以是各种深度神经网络,比如卷积神经网络。
剪枝相关参数可以是会影响目标模型的剪枝、与剪枝相关的各种参数,比如可以包括剪枝率。
步骤202,确定包含剪枝相关参数的多个候选值的搜索空间。
在本实施例中,上述执行主体可以确定搜索空间,具体地,上述搜索空间中可以包含上述剪枝相关参数的多个候选值。
步骤203,将训练脚本作为第一组件,并调用第一组件,在搜索空间中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
在本实施例中,上述执行主体可以通过调用作为组件的训练脚本,在搜索空间中搜索剪枝相关参数的一个候选值,作为目标值。本申请中的组件设置有用于调用的接口。具体地,将训练脚本作为第一组件,也即生成包含训练脚本的第一组件。在实践中,该搜索出的候选值符合搜索任务,搜索任务可以为搜索剪枝相关参数的候选值,以使目标模型的准确度最大化,并且各层对应的通道数最小化。上述执行主体或其它电子设备利用剪枝相关参数的该目标值可以实现对目标模型的剪枝。剪枝后的目标模型中处理层对应的通道数会变小。
在搜索过程中,上述执行主体需要利用上述多个候选值中的各个候选值(比如至少一个处理层中每层的剪枝率的候选值)对训练脚本中的模型脚本进行剪枝,得到一个模型,然后利用数据集训练这个模型,并验证该模型的准确度。并基于该准确度搜索出剪枝相关参数的目标值。
在相关技术中,往往需要在模型的代码中,植入剪枝的代码,从而实现剪枝。
本申请的上述实施例提供的方法可以将训练脚本进行组件化,从而在不修改训练脚本的内容的情况下,实现自动化搜索剪枝相关数据的目标值,避免了在训练脚本中硬编码剪枝脚本带来的高耦合度,提高了对模型进行剪枝的灵活性。
在本实施例的一些可选的实现方式中,剪枝率的候选值基于以下的至少一项确定:剪枝率的最大值、剪枝率的最小值和剪枝率间隔。
在这些可选的实现方式中,上述执行主体可以基于以下三项中的至少一项确定剪枝率的候选值:剪枝率的最大值、剪枝率的最小值和剪枝率间隔。剪枝率的最大值确定了剪枝率的候选值的最大值,剪枝率的最小值确定了剪枝率的候选值的最小值,也即剪枝率的候选值不能大于该最大值且不能小于该最小值。剪枝率间隔指剪枝率的相邻候选值之间的间隔。在实践中,上述执行主体可以针对目标模型的至少一个处理层,分别确定上述任意一项。这几项可以是用户设定的,比如用户通过用户设备发送(即上传)到本设备的。
举例来说,剪枝率的最大值可以是0.9,剪枝率的最小值可以是0.05,剪枝率间隔可以是0.01,得到的剪枝率的候选值可以包括0.05、0.06、0.07…0.89、0.9。
这些实现方式通过限定剪枝率的取值范围,以及取值频率可以得到符合该限定也即符合限定人意愿的剪枝率。
在本实施例的一些可选的实现方式中,目标模型的剪枝相关参数包括目标模型的至少一个处理层中每个处理层的剪枝相关参数;步骤203可以包括:对于至少一个处理层中每个处理层,调用第一组件,在搜索空间中对该处理层搜索剪枝相关参数的一个候选值,作为该处理层的剪枝相关参数的目标值。
在这些可选的实现方式中,上述执行主体可以对目标模型的每个处理层(layer)的剪枝相关参数确定目标值,该目标值用于对该处理层进行剪枝。至少一个处理层可以是采用各种方式确定的,例如可以是指定的,比如用户指定的,此外至少一个处理层还可以是目标模型所有的处理层。
这些实现方式可以对各个处理层确定剪枝相关参数,从而有助于提高对目标模型进行剪枝的准确度。
在这些可选方式的一些可选的应用场景中,上述方法还可以包括:对于至少一个处理层中每个处理层,利用对该处理层搜索到的、剪枝相关参数的目标值,对该处理层进行剪枝;利用剪枝后的各个处理层,更新目标模型。
在这些可选的应用场景中,上述执行主体可以利用对至少一个处理层中每个处理层搜索到的目标值,对每个处理层进行剪枝。对于上述至少一个处理层中的每个处理层,均采用剪枝后的该处理层,从而实现对目标模型进行更新。
这些应用场景可以利用每层的目标值进行自动化剪枝,从而得到准确度高、性能好的模型。
在这些可选方式的一些可选的应用场景中,上述方法还可以包括:基于训练脚本,判断目标模型中是否存在支持剪枝的处理层;若目标模型中不存在支持剪枝的处理层,则输出提示信息;步骤202可以包括:若目标模型中存在支持剪枝的处理层,确定包含剪枝相关参数的多个候选值的搜索空间,其中,支持剪枝的处理层为至少一个处理层。
在这些可选的应用场景中,上述执行主体可以基于训练脚本判断目标模型中是否存在支持剪枝的处理层。并在判断结果为否的情况下,输出提示信息,以使用户能够知道判断结果。该提示信息用于指示为否的判断结果,也即目标模型中不存在支持剪枝的处理层。此外,上述执行主体还可以在判断结果为是的情况下确定搜索空间。
在实践中,上述执行主体可以采用各种方式基于训练脚本进行判断。比如,上述执行主体可以判断训练脚本中的模型脚本中处理层的脚本是否支持复制、读取和修改,若是,则判断该处理层支持剪枝。这样,上述执行主体可以调用第一组件,并复制第一组件中的模型脚本,以利用复制的模型脚本进行搜索。或者,上述执行主体还可以将指定的处理层判断为支持剪枝的处理层,具体可以是用户指定的。此外,上述执行主体还可以将脚本标准化的处理层也即脚本符合预设标准的处理层,判断为支持剪枝的处理层。上述执行主体也可以采用上述三种判断方式中的至少两者进行判断,也即在利用上述至少两种判断方式判断处理层且均成立的情况下,确定该处理层支持剪枝。
这些应用场景可以首先判断处理层是否支持剪枝,避免进行无效的剪枝步骤。
继续参见图3,图3是根据本实施例的用于对模型剪枝的方法的应用场景的一个示意图。在图3的应用场景中,执行主体301获取目标模型的训练脚本302,以及与目标模型的剪枝相关联的剪枝相关参数303,其中,剪枝相关参数包括剪枝率。确定包含剪枝相关参数的多个候选值的搜索空间304。将训练脚本作为第一组件,并调用第一组件,在搜索空间304中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值305。
进一步参考图4,其示出了用于对模型剪枝的方法的又一个实施例的流程400。该流程400,包括以下步骤:
步骤401,获取目标模型的训练脚本,以及与目标模型的剪枝相关联的剪枝相关参数,其中,剪枝相关参数包括剪枝率。
在本实施例中,用于对模型剪枝的方法运行于其上的执行主体(例如图1所示的服务器或终端设备)可以获取目标模型的训练脚本,并获取与该目标模型的剪枝有关的剪枝相关参数。
步骤402,将剪枝相关参数的多个候选值作为第二组件。
在本实施例中,上述执行主体可以将与目标模型的剪枝相关联的剪枝相关参数的多个候选值作为组件,也即第二组件。
步骤403,调用第二组件,确定包含剪枝相关参数的多个候选值的搜索空间。
在本实施例中,上述执行主体可以通过调用第二组件,来确定包含上述剪枝相关参数的多个候选值的搜索空间。组件中为上述剪枝相关参数的多个候选值,因此,上述执行主体调用第二组件,就可以生成包含上述多个候选值的搜索空间。
步骤404,将训练脚本作为第一组件,并调用第一组件,在搜索空间中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
在本实施例中,上述执行主体可以通过调用作为组件的训练脚本,在搜索空间中搜索剪枝相关参数的候选值,作为目标值。本申请中的组件设置有用于调用的接口。在实践中,该候选值符合搜索任务,搜索任务可以为搜索剪枝相关参数的候选值,以使目标模型的准确度最大化,并且各层对应的通道数最小化。
本实施例可以通过调用第二组件,避免对剪枝相关参数的多个候选值进行修改,从而实现利用参数且保留完整的原参数数值。
在本实施例的一些可选的实现方式中,上述方法还可以包括:获取与目标模型的剪枝相关联的配置信息,并将配置信息作为第三组件,其中,配置信息用于指示是否调用组件在目标模型的剪枝相关参数的候选值中进行搜索;以及步骤403可以包括:响应于调用第三组件,确定所获取的配置信息指示调用组件在目标模型的剪枝相关参数的候选值中进行搜索,调用第二组件,确定包含剪枝相关参数的多个候选值的搜索空间。
在这些可选的实现方式中,上述执行主体可以获取指示是否调用组件在剪枝相关参数的候选值中进行搜索。具体地,上述执行主体可以将配置信息作为第三组件,调用该第三组件来确定配置信息是否指示需要调用组件进行搜索。具体地,搜索过程所调用的组件可以包括第一组件。
在调用第三组件确定需要调用组件进行搜索的情况下,上述执行主体可以确定包含上述多个候选值的搜索空间。而在响应于调用第三组件,确定所获取的配置信息指示不调用组件在目标模型的剪枝相关参数的候选值中进行搜索的情况下,则无法搜索获取到最优的剪枝方式,上述执行主体可以获取指定的剪枝方式,用于进行剪枝。指定的剪枝方式可以是均匀剪枝、基于敏感度的剪枝等等。
这些实现方式可以将配置信息组件化,从而避免了对原始的配置信息的改动,确保了原始配置信息的准确和完整。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于对模型剪枝的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,除下面所记载的特征外,该装置实施例还可以包括与图2所示的方法实施例相同或相应的特征或效果。该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于对模型剪枝的装置500包括:第一获取单501、确定单元502和调用单元503。其中,第一获取单元501,被配置成获取目标模型的训练脚本,以及与目标模型的剪枝相关联的剪枝相关参数,其中,剪枝相关参数包括剪枝率;确定单元502,被配置成确定包含剪枝相关参数的多个候选值的搜索空间;调用单元503,被配置成将训练脚本作为第一组件,并调用第一组件,在搜索空间中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
在本实施例中,用于对模型剪枝的装置500的第一获取单元501、确定单元502和调用单元503的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202和步骤203的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,确定单元,进一步被配置成按照如下方式执行确定包含剪枝相关参数的多个候选值的搜索空间:将剪枝相关参数的多个候选值作为第二组件;调用第二组件,确定包含剪枝相关参数的多个候选值的搜索空间。
在本实施例的一些可选的实现方式中,装置还包括:第二获取单元,被配置成获取与目标模型的剪枝相关联的配置信息,并将配置信息作为第三组件,其中,配置信息用于指示是否调用组件在目标模型的剪枝相关参数的候选值中进行搜索;以及确定单元,进一步被配置成按照如下方式执行调用第二组件,确定包含剪枝相关参数的多个候选值的搜索空间:响应于调用第三组件,确定所获取的配置信息指示调用组件在目标模型的剪枝相关参数的候选值中进行搜索,调用第二组件,确定包含剪枝相关参数的多个候选值的搜索空间。
在本实施例的一些可选的实现方式中,目标模型的剪枝相关参数包括目标模型的至少一个处理层中每个处理层的剪枝相关参数;调用单元,进一步被配置成按照如下方式执行调用第一组件,在搜索空间中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值:对于至少一个处理层中每个处理层,调用第一组件,在搜索空间中对该处理层搜索剪枝相关参数的一个候选值,作为该处理层的剪枝相关参数的目标值。
在本实施例的一些可选的实现方式中,装置还包括:剪枝单元,被配置成对于至少一个处理层中每个处理层,利用对该处理层搜索到的、剪枝相关参数的目标值,对该处理层进行剪枝;更新单元,被配置成利用剪枝后的各个处理层,更新目标模型。
在本实施例的一些可选的实现方式中,装置还包括:判断单元,被配置成基于训练脚本,判断目标模型中是否存在支持剪枝的处理层;输出单元,被配置成若目标模型中不存在支持剪枝的处理层,则输出提示信息;以及确定单元,进一步被配置成按照如下方式执行确定包含剪枝相关参数的多个候选值的搜索空间:若目标模型中存在支持剪枝的处理层,确定包含剪枝相关参数的多个候选值的搜索空间,其中,支持剪枝的处理层为至少一个处理层。
在本实施例的一些可选的实现方式中,剪枝率的候选值基于以下的至少一项确定:剪枝率的最大值、剪枝率的最小值和剪枝率间隔。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是根据本申请实施例的用于对模型剪枝的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的用于对模型剪枝的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用于对模型剪枝的方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用于对模型剪枝的方法对应的程序指令/模块(例如,附图5所示的第一获取单501、确定单元502和调用单元503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用于对模型剪枝的方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于对模型剪枝的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至用于对模型剪枝的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于对模型剪枝的方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与用于对模型剪枝的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一获取单、确定单元和调用单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,确定单元还可以被描述为“确定包含剪枝相关参数的多个候选值的搜索空间的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取目标模型的训练脚本,以及与目标模型的剪枝相关联的剪枝相关参数,其中,剪枝相关参数包括剪枝率;确定包含剪枝相关参数的多个候选值的搜索空间;将训练脚本作为第一组件,并调用第一组件,在搜索空间中搜索剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (15)
1.一种用于对模型剪枝的方法,所述方法包括:
获取目标模型的训练脚本,以及与所述目标模型的剪枝相关联的剪枝相关参数,其中,所述剪枝相关参数包括剪枝率;
确定包含所述剪枝相关参数的多个候选值的搜索空间;
将所述训练脚本作为第一组件,并调用所述第一组件,在所述搜索空间中搜索所述剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
2.根据权利要求1所述的方法,其中,所述确定包含所述剪枝相关参数的多个候选值的搜索空间,包括:
将所述剪枝相关参数的多个候选值作为第二组件;
调用所述第二组件,确定包含所述剪枝相关参数的多个候选值的搜索空间。
3.根据权利要求2所述的方法,其中,所述方法还包括:
获取与所述目标模型的剪枝相关联的配置信息,并将所述配置信息作为第三组件,其中,所述配置信息用于指示是否调用组件在所述目标模型的剪枝相关参数的候选值中进行搜索;以及
所述调用所述第二组件,确定包含所述剪枝相关参数的多个候选值的搜索空间,包括:
响应于调用所述第三组件,确定所获取的配置信息指示调用组件在所述目标模型的剪枝相关参数的候选值中进行搜索,调用所述第二组件,确定包含所述剪枝相关参数的多个候选值的搜索空间。
4.根据权利要求1或2所述的方法,其中,所述目标模型的剪枝相关参数包括所述目标模型的至少一个处理层中每个处理层的剪枝相关参数;
所述调用所述第一组件,在所述搜索空间中搜索所述剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值,包括:
对于至少一个处理层中每个处理层,调用所述第一组件,在所述搜索空间中对该处理层搜索所述剪枝相关参数的一个候选值,作为该处理层的所述剪枝相关参数的目标值。
5.根据权利要求4所述的方法,其中,所述方法还包括:
对于至少一个处理层中每个处理层,利用对该处理层搜索到的、所述剪枝相关参数的目标值,对该处理层进行剪枝;
利用剪枝后的各个处理层,更新所述目标模型。
6.根据权利要求4所述的方法,其中,所述方法还包括:
基于所述训练脚本,判断所述目标模型中是否存在支持剪枝的处理层;
若所述目标模型中不存在支持剪枝的处理层,则输出提示信息;以及
所述确定包含所述剪枝相关参数的多个候选值的搜索空间,包括:
若所述目标模型中存在支持剪枝的处理层,确定包含所述剪枝相关参数的多个候选值的搜索空间,其中,所述支持剪枝的处理层为所述至少一个处理层。
7.根据权利要求1所述的方法,其中,所述剪枝率的候选值基于以下的至少一项确定:剪枝率的最大值、剪枝率的最小值和剪枝率间隔。
8.一种用于对模型剪枝的装置,所述装置包括:
第一获取单元,被配置成获取目标模型的训练脚本,以及与所述目标模型的剪枝相关联的剪枝相关参数,其中,所述剪枝相关参数包括剪枝率;
确定单元,被配置成确定包含所述剪枝相关参数的多个候选值的搜索空间;
调用单元,被配置成将所述训练脚本作为第一组件,并调用所述第一组件,在所述搜索空间中搜索所述剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值。
9.根据权利要求8所述的装置,其中,所述确定单元,进一步被配置成按照如下方式执行所述确定包含所述剪枝相关参数的多个候选值的搜索空间:
将所述剪枝相关参数的多个候选值作为第二组件;
调用所述第二组件,确定包含所述剪枝相关参数的多个候选值的搜索空间。
10.根据权利要求9所述的装置,其中,所述装置还包括:
第二获取单元,被配置成获取与所述目标模型的剪枝相关联的配置信息,并将所述配置信息作为第三组件,其中,所述配置信息用于指示是否调用组件在所述目标模型的剪枝相关参数的候选值中进行搜索;以及
所述确定单元,进一步被配置成按照如下方式执行所述调用所述第二组件,确定包含所述剪枝相关参数的多个候选值的搜索空间:
响应于调用所述第三组件,确定所获取的配置信息指示调用组件在所述目标模型的剪枝相关参数的候选值中进行搜索,调用所述第二组件,确定包含所述剪枝相关参数的多个候选值的搜索空间。
11.根据权利要求8或9所述的装置,其中,所述目标模型的剪枝相关参数包括所述目标模型的至少一个处理层中每个处理层的剪枝相关参数;
所述调用单元,进一步被配置成按照如下方式执行所述调用所述第一组件,在所述搜索空间中搜索所述剪枝相关参数的一个候选值,作为用于对目标模型进行剪枝的目标值:
对于至少一个处理层中每个处理层,调用所述第一组件,在所述搜索空间中对该处理层搜索所述剪枝相关参数的一个候选值,作为该处理层的所述剪枝相关参数的目标值。
12.根据权利要求11所述的装置,其中,所述装置还包括:
剪枝单元,被配置成对于至少一个处理层中每个处理层,利用对该处理层搜索到的、所述剪枝相关参数的目标值,对该处理层进行剪枝;
更新单元,被配置成利用剪枝后的各个处理层,更新所述目标模型。
13.根据权利要求11所述的装置,其中,所述装置还包括:
判断单元,被配置成基于所述训练脚本,判断所述目标模型中是否存在支持剪枝的处理层;
输出单元,被配置成若所述目标模型中不存在支持剪枝的处理层,则输出提示信息;以及
所述确定单元,进一步被配置成按照如下方式执行所述确定包含所述剪枝相关参数的多个候选值的搜索空间:
若所述目标模型中存在支持剪枝的处理层,确定包含所述剪枝相关参数的多个候选值的搜索空间,其中,所述支持剪枝的处理层为所述至少一个处理层。
14.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010388363.2A CN111582480A (zh) | 2020-05-09 | 2020-05-09 | 用于对模型剪枝的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010388363.2A CN111582480A (zh) | 2020-05-09 | 2020-05-09 | 用于对模型剪枝的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111582480A true CN111582480A (zh) | 2020-08-25 |
Family
ID=72123477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010388363.2A Pending CN111582480A (zh) | 2020-05-09 | 2020-05-09 | 用于对模型剪枝的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582480A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508182A (zh) * | 2020-12-22 | 2021-03-16 | 北京百度网讯科技有限公司 | 机器学习模型的剪枝方法、装置、设备、程序产品及介质 |
-
2020
- 2020-05-09 CN CN202010388363.2A patent/CN111582480A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508182A (zh) * | 2020-12-22 | 2021-03-16 | 北京百度网讯科技有限公司 | 机器学习模型的剪枝方法、装置、设备、程序产品及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7166322B2 (ja) | モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
EP3828719A2 (en) | Method and apparatus for generating model for representing heterogeneous graph node, electronic device, storage medium, and computer program product | |
EP3916630A1 (en) | Method and apparatus for identifying video | |
CN111680517B (zh) | 用于训练模型的方法、装置、设备以及存储介质 | |
CN111966361B (zh) | 用于确定待部署模型的方法、装置、设备及其存储介质 | |
CN111752843A (zh) | 用于确定影响面的方法、装置、电子设备及可读存储介质 | |
CN111582477A (zh) | 神经网络模型的训练方法和装置 | |
CN111883127A (zh) | 用于处理语音的方法和装置 | |
CN113238943A (zh) | 持续集成测试的方法和装置 | |
CN114816393B (zh) | 信息生成方法、装置、设备以及存储介质 | |
CN111753964A (zh) | 神经网络的训练方法和装置 | |
CN111752960A (zh) | 数据处理方法和装置 | |
CN112579897B (zh) | 信息搜索方法和装置 | |
CN112015439B (zh) | 用户app兴趣的嵌入方法、装置、设备以及存储介质 | |
CN112329429B (zh) | 文本相似度学习方法、装置、设备以及存储介质 | |
CN111738325B (zh) | 图像识别方法、装置、设备以及存储介质 | |
CN112561059A (zh) | 用于模型蒸馏的方法和装置 | |
CN111582480A (zh) | 用于对模型剪枝的方法和装置 | |
CN112382292A (zh) | 基于语音的控制方法和装置 | |
CN111767990A (zh) | 神经网络的处理方法和装置 | |
CN113656689B (zh) | 模型生成方法和网络信息的推送方法 | |
CN111177479A (zh) | 获取关系网络图中节点的特征向量的方法以及装置 | |
CN111680508B (zh) | 文本的处理方法和装置 | |
CN111522837B (zh) | 用于确定深度神经网络的耗时的方法和装置 | |
CN112735601B (zh) | 利用蓝牙确定传染病密接人群的测试方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200825 |