WO2018068623A1

WO2018068623A1 - 一种机器学习方法及系统

Info

Publication number: WO2018068623A1
Application number: PCT/CN2017/102836
Authority: WO
Inventors: 赵凌; 李季檩
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-10-14
Filing date: 2017-09-22
Publication date: 2018-04-19
Also published as: CN106529679A; CN106529679B

Abstract

本申请各实施例公开了机器学习方法及系统，应用于信息处理技术领域。在本实施例的方法中，机器学习系统会根据机器学习模型的各层计算架构对应的存储空间的大小分配一个存储空间，这样各层计算架构可以循环利用该存储空间。本实施例的方法可以很大程度地减少了机器学习模型运行时所需的存储空间，从而提升了系统性能。

Description

一种机器学习方法及系统

相关文件

本申请要求2016年10月14日提交中国专利局、申请号为201610898838.6、申请各实施例名称为“一种机器学习方法及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息处理技术领域，特别涉及一种机器学习方法及系统。

背景

深度学习(Deep Learning)是机器学习的一种。深度学习技术通过建立神经网络，模拟生物神经系统的机制，从大量的数据中学习各种表征(representations)，用于解释数据，如图像、声音、文本，等。深度学习技术可以应用于诸如计算机视觉、语音识别、自然语言处理、社交网络过滤、机器翻译、生物信息学等领域。深度学习使用一连串多个层级的非线性处理单元来提取特征并进行变换。其中，每个层级中的非线性处理单元可以称为一个计算架构。各层级的计算架构使用前一层计算架构的输出作为输入，从而从较低层级的数据特征中提取出更高层级的数据特征。各层级的计算架构的存储空间相互独立。深度学习算法中，各层级的非线性处理单元的组成与该层级解决的问题有关。算法的复杂度越高，所需的总存储空间越大。

技术内容

本申请实施例提供一种机器学习方法及系统，实现了为机器学习模型分配整体存储空间，以便机器学习模型的各层计算架构循环利用。

本申请实施例提供一种机器学习方法，包括：

分别确定机器学习模型的各层计算架构所需的存储空间的大小；

根据所述各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，使得所述存储空间的大小足够储存任一层计算架构运行时所需的信息且小于所述各层计算架构所需的存储空间的大小之和；

所述机器学习模型的各层计算架构分别利用所述存储空间进行相应计算。

本申请实施例还提供一种计算设备，包括：处理器和存储器，所述存储器中存储有机器可读指令，可以使所述处理器：

所述机器学习模型的各层计算架构分别利用所述存储空间进行计算。

本申请实施例还提供一种机器可读存储介质，其中存储有机器可读指令，所述指令可以由处理器执行用于：

根据所述各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，使得所述存储空间的大小足够储存任一层计算架构运行时涉及的信息且小于所述各层计算架构所需的存储空间的大小之和；

可见，在本实施例的方法中，机器学习系统会根据机器学习模型的各层计算架构对应的存储空间的存储值分配一个整体存储空间，这样各层计算架构可以循环利用该整体存储空间。相比现有技术中，需要为各层计算架构分别分配对应的存储空间，本实施例的方法可以减少因分配多个存储空间而造成的存储碎片，且很大程度地减少了机器学习模型运行时所需的存储空间，从而提升了系统性能，这样就可以将该机器学习方法运行于存储受限的终端设备。

附图简要说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种机器学习方法的流程图；

图2a是本申请实施例中确定某一层计算架构对应的存储空间的存储值的方法流程图；

图2b是本申请实施例中确定某一层计算架构对应的存储空间的存储值的方法流程图；

图3是本申请实施例中某一层计算架构利用整体存储空间进行相应计算的方法流程图；

图4是本申请实施例中各层计算架构循环利用整体存储空间的示意图；

图5是本申请应用实施例中提供的一种机器学习方法的流程图；

图6是本申请实施例提供的一种机器学习系统的结构示意图；

图7是本申请实施例提供的另一种机器学习系统的结构示意图；

图8是本申请实施例提供的一种终端设备的结构示意图；

图9是本申请实施例提供的一种嵌入式设备的结构示意图；

图10是本申请实施例提供的一种服务器的结构示意图；

图11是本申请实施例提供的一种使用机器学习系统的场景示意图；

图12为一些实施例中各层计算架构分别利用分配的存储空间进行计算的方法流程图；

图13为一些实施例中各层计算架构分别利用分配的存储空间进行计算的方法流程图；

图14为一些实施例中各层计算架构分别利用存储空间的示意图；

图15为一些实施例中，各层计算架构分别利用分配的存储空间进行计算的方法流程图。

实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)仅仅是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排它的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例提供一种机器学习方法。该方法可以由机器学习系统，比如深度学习系统等执行。该机器学习系统可以由计算设备实现。计算设备可以是服务器、终端设备(如PC、智能手机、平板电脑，等)、嵌入式设备等。如图1所示，该方法可以包括以下步骤。

步骤101，分别确定机器学习模型的各层计算架构所需存储空间的大小。

机器学习模型是包括多层计算架构的计算模块。各层计算架构可以是采用不同的计算架构，如卷积层，相加层，相减层等，这些层组合起来形成机器学习模型的计算架构，以实现一定的功能，比如通过深度学习进行前向预测等功能。机器学习系统是指包括机器学习模型及周边功能的计算系统。周边功能可以包括，但不限于，初始化功能、存储空间分配功能、计算结果输出功能，等。

每一层计算架构都包括输入单元、计算单元和输出单元，这些单元在运行时都会占用一定的存储空间，因此，某一层计算架构对应的存储空间包括该层计算架构所包括的各个单元在运行时所需的存储空间。在执行本步骤时，机器学习系统会根据机器学习模型的配置文件来获取。

步骤102，根据步骤101确定的各层计算架构的存储空间的存储值为机器学习模型分配对应的存储空间，使得该存储空间能储存任一层计算架构运行时所需的信息。

本实施例中，机器学习系统为机器学习模型分配一个存储空间(也称为整体存储空间)，使得各层计算架构运行时循环利用该存储空间，该存储空间需要足够储存任一层计算架构运行时所需的信息。比如该存储空间的大小(也称为存储空间的存储值)与各层计算架构的存储空间中最大存储空间的大小一致。

步骤103，机器学习模型的各层计算架构分别利用分配的存储空间进行计算。

可见，在本实施例的方法中，机器学习系统会根据机器学习模型的各层计算架构对应的存储空间的大小分配一个存储空间，这样各层计算架构可以循环利用该存储空间，可以很大程度地减少机器学习模型运行时所需的存储空间，使得该机器学习方法可以运行于存储受限的设备，如终端设备、嵌入式设备中。同时，还可以避免计算平台逐个为各层计算架构分配存储空间，减少了存储碎片的形成。

在一些实施例中，机器学习系统在执行上述步骤101中确定某一层计算架构对应的存储空间的大小，可以通过图2a所示的方法来实现。

步骤201，获取机器学习模型的配置文件，配置文件中包括某一层计算架构的计算参数的信息，输入参数的信息及结构信息。

其中，计算参数是指该层计算架构在计算时所用到的具有固定值的参数，比如一些系数等。计算参数的信息可以包括计算参数的大小和类型等信息。结构信息可以包括该层计算架构的描述信息等。输入参数是指计算架构在计算时需要的一个未知数值，其取值需要从外部获得。输入参数的信息可以包括输入参数的大小和类型等信息。

步骤202，根据输入参数的信息，计算参数的信息及结构信息确定某一层计算架构的输出参数的大小。

例如，机器学习系统可以根据输入参数的信息对输入参数进行赋值，并根据结构信息及输入参数的赋值计算出输出参数，然后即可确定输出参数的大小。

这里，计算架构的输入参数的大小是指在该计算架构的计算过程中所需的输入数据的大小；输出参数的大小是指在该计算架构计算输出的数据的大小。输入数据为计算架构为进行计算而获取的作为输入参数的值，即输入参数值；输出数据是计算架构计算得到的输出参数的值，即输出参数值。

步骤203，将输入参数的大小，输出参数的大小及计算参数的大小之和作为某一层计算架构对应的存储空间的大小。

在这种情况下，机器学习系统在执行上述步骤102时，可以确定各层计算架构对应的存储空间中存储空间大小的最大值，这样在分配存储空间时，使得分配的存储空间的大小与最大存储空间的大小一致。

在一些实施例中，机器学习系统在执行上述步骤101中确定某一层计算架构对应的存储空间的大小，可以通过图2b所示的方法来实现。

图2b中的步骤201、202与图2a中的步骤201、202相同，不再赘述。

步骤204，确定某一层计算架构对应的存储空间的大小包括：储存输入参数所需的存储空间的大小，储存计算参数所需的存储空间的大小及储存输出参数所需的存储空间的大小，即该层计算架构所包括的输入单元、计算单元和输出单元分别占用的存储空间的大小。

在这种情况下，机器学习系统在执行上述步骤102时，具体可以确定各层计算架构对应的存储空间中储存输入参数的第一最大空间的存储值(即各层计算架构储存输入参数所需存储空间大小中的最大值，以下称为第一最大值)，储存计算参数的第二最大空间的存储值(即各层计算架构储存计算参数所需的存储空间大小中的最大值，以下称为第二最大值)及储存输出参数的第三最大空间的存储值(即各层计算架构储存输出参数所需的存储空间大小中的最大值，以下称为第三最大值)。这样在分配整体存储空间时，使得整体存储空间的大小是第一最大值，第二最大值及第三最大值之和。

比如，一个机器学习模型有3层计算架构，第一层计算架构需要的储存输入参数，计算参数和输出参数的存储空间大小分别为a1，a2和a3，第二层计算架构需要的储存输入参数，计算参数和输出参数的存储空间大小分别为b1，b2和b3，第三层计算架构需要的储存输入参数，计算参数和输出参数的存储空间的大小分别为c1，c2和c3，其中，a1大于b1且大于c1，b2大于a2且大于c2，c3大于a2且大于b2，则确定第一最大值，第二最大值及第三最大值分别为a1，b2和c3，因此，分配的存储空间的大小为a1+b2+c3。

其中，第一最大值，第二最大值和第三最大值并不是指大小排在前面三个位置的空间大小，而是指不同维度的最大空间，即分别用于存储输入参数、计算参数和输出参数的三个存储空间大小的最大值。

图12为一些实施例中，各层计算架构分别利用分配的存储空间进行计算的方法流程图。如图12所示，该方法可以包括以下步骤。

步骤501，将第一层计算架构的第一输出数据写入所述存储空间。

步骤502，第二层计算架构将所述第一输出数据作为输入数据，利用所述存储空间执行所述第二层计算架构的计算。

步骤503，将所述第二层计算架构的第二输出数据写入所述存储空间。

本文中，“第一层”、“第二层”等并不是指执行顺序排在前面的计算架构，而是指各计算架构中任意的计算架构，“第一”、“第二”、“第三”仅用于区分描述中涉及的几个计算架构。

一些实施例中，步骤502中，将所述第一输出数据作为第二层计算架构的输入数据，利用所述存储空间执行所述第二层计算架构的计算可以包括：

将所述第一输出数据的存储位置提供给所述第二层计算架构；

所述第二层计算架构从所述存储位置读取所述第一输出数据作为所述输入数据，并将计算结果作为所述第二输出数据写入所述存储空间。

第一输出数据的存储位置可以作为参数由第一层计算架构传递给第二层计算架构。第一输出数据的存储位置可以通过对预设变量进行赋值进行传递。例如，可以将第二层计算架构的输入数据的指针变量赋值为第一输出数据的存储地址，第二层计算架构可以直接利用该指针进行计算。这样，该数据传递过程不需要数据拷贝和传输，节约了计算量，提高了计算效率。此外，指针的赋值还可以在预处理阶段完成。例如，在为机器学习模型分配存储空间后，就可以为各计算架构的输入数据指针和输出数据指针进行赋值，使得相邻两层中前一层的输出数据的指针的值与后一层的输入数据的指针的值相同。这样，可以进一步减少处理步骤，提高处理效率。

一些实施例中，可以将分配的存储空间划分出两个或更多个子存储空间，各层计算架构可以依次轮换使用这些子存储空间来存储输出数据。

图13为一些实施例中，各层计算架构分别利用分配的存储空间进行计算的方法流程图。如图13所示，该方法可以包括以下步骤。

步骤601，将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间。

步骤602，所述第一层计算架构将计算得到的第一输出数据储存到所述存储空间中的第二存储空间。

步骤603，第二层计算架构将所述第二存储空间存储的第一输出数据作为输入数据，将计算得到的第二输出数据存储到所述第一存储空间。

步骤604，第三层计算架构将所述第一存储空间存储的第二输出数据作为输入数据。

如图14所示，当第一层计算架构为处理层n-1时，处理层n-1可以将输出数据存储到分配的存储空间中的一个子存储空间，如存储空间B(即第二存储空间)中(步骤602)。第二层计算架构，即处理层n，将存储空间B中的数据作为输入数据，将计算得到的输出数据存储到分配的存储空间中的另一个子存储空间，即存储空间A(第一存储空间)(步骤603)。第三层计算架构，即处理层n+1，将存储空间A中存储的数据作为输入数据(步骤604)。

在该实施例中，第一存储空间和第二存储空间为分配的存储空间中的子存储空间。一些例子中，第一存储空间和第二存储空间的大小均为各层计算架构用于存储输入参数和输出参数的存储空间大小的最大值，即上述第一最大值和第三最大值中的较大的值。

图15为一些实施例中，各层计算架构分别利用分配的存储空间进行计算的方法流程图。如图15所示，该方法可以包括以下步骤。

步骤701，将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间；

步骤702，将所述第一层计算架构的计算参数储存到所述存储空间中的第二存储空间；

步骤703，将所述第一层计算架构根据所述输入数据和所述计算参数计算得到的第一输出数据储存到所述存储空间中的第三存储空间；

步骤704，将所述第三存储空间存储的第一输出数据作为第二层计算架构的输入数据，将所述第二层计算架构计算得到的第二输出数据存储到所述第一存储空间或所述第二存储空间；

步骤705，将所述第一存储空间或所述第二存储空间存储的第二输出数据作为第三层计算架构的输入数据。

在该实施例中，第一存储空间、第二存储空间和第三存储空间均为分配的存储空间中的子存储空间。一些例子中，第一存储空间、第二存储空间和第三存储空间的大小均为各层计算架构用于存储输入参数、计算参数和输出参数的三个存储空间大小的最大值，即上述第一最大值、第二最大值、第三最大值中的最大值。

以上各子存储空间的位置也可以通过参数赋值来通知各层计算架构。例如，可以对各层计算架构的输入数据的指针和输出数据的指针分别进行赋值，如前所述，这里不再赘述。

在一些实施例中，机器学习系统在执行上述步骤103时，某一层计算架构利用上述分配的存储空间进行计算的过程可以如图3所示。

步骤301，机器学习系统将某一层计算架构的计算参数储存到存储空间中的第二存储空间。

步骤302，某一层计算架构将存储空间中的第一存储空间作为储存对应输入参数的空间。

步骤303，某一层计算架构根据输入参数和计算参数计算得到输出参数，将输出参数储存到存储空间中的第三存储空间。

如果某一层计算架构为第一层计算架构，即排在机器学习模型的第一位置的一层计算架构，则第一层计算架构的输入参数可以是用户输入到机器学习系统的；如果某一层计算架构为非第一层计算架构，非第一层计算架构在执行上述步骤301到303时，上述步骤301中的第一存储空间为某一层计算架构的前一层计算架构储存输出参数的空间，且某一层计算架构的输入参数为前一层计算架构的输出参数；而上述步骤303中的第三存储空间为前一层计算架构储存输入参数的空间。

例如，参考图4所示为机器学习系统分配的存储空间，可以包括第一存储空间，第二存储空间和第三存储空间，在初始计算时，机器学习系统会将第一层计算架构的输入参数储存到第一存储空间，将第一层计算架构的计算参数储存到第二存储空间，这样第一层计算架构就会根据输入参数和计算参数计算得到输出参数，将输出参数输出到第三层存储空间。之后，机器学习系统可以将第三存储空间的地址指针直接赋给储存第二层计算架构的输入参数的空间，将第二层存储空间的地址指针直接赋给存储第二层计算架构的计算参数的空间，将第一存储空间的地址指针赋给第二层计算架构的输出参数的空间。

这样机器学习系统可以根据第二层存储空间的地址指针，将第二层计算架构的计算参数储存到第二存储空间中，是采用覆盖式地储存方式，即用第二层计算架构的计算参数直接覆盖第二存储空间中已经的信息，然后第二层计算架构将第三层存储空间中储存的信息作为第二层计算架构的输入参数，并根据输入参数及第二存储空间中储存的计算参数计算得到输出参数，将输出参数输出到第一存储空间。可见，采用指针赋值的方法，第二层计算架构可以循环利用存储空间。

之后，机器学习系统会将第一存储空间的地址指针直接赋给储存第三层计算架构的输入参数的空间，将第二层存储空间的地址指针直接赋给存储第三层计算架构的计算参数的空间，将第三存储空间的地址指针赋给第三层计算架构的输出参数的空间，这样第三层计算架构就可以循环利用存储空间进行相应计算。按照上述的方法，以此类推，机器学习模型的各层计算架构逐层地利用存储空间进行相应计算，很大程度地减少了机器学习模型运行时所需的存储空间，从而提升了系统性能。

在一些实施例中，机器学习系统为深度学习系统，机器学习模型为深度学习模型。该深度学习模型包括n层计算架构，本实施例中以n为3为例说明。则本实施例的方法流程图如图5所示，包括如下步骤。

步骤401，深度学习系统获取深度学习模型的配置文件，在配置文件中包括3层计算架构分别对应的计算参数的信息，输入参数的信息及结构信息。

步骤402，深度学习系统针对每一层计算架构，根据输入参数的信息对输入参数进行赋值，并根据结构信息及输入参数的赋值计算出输出参数，从而确定对应一层计算架构的输出参数的大小。

步骤403，深度学习系统将每一层计算架构的输入参数的大小，输出参数的大小及计算参数的大小之和作为对应一层计算架构对应的存储空间的大小。

或者，深度学习系统确定每一层计算架构对应的存储空间的大小包括：确定储存输入参数所需的存储空间的大小，储存计算参数所需的存储空间的大小及储存输出参数所需的存储空间的大小。

步骤404，为深度学习模型分配存储空间。

其中，如果深度学习系统确定的每一层计算架构的存储空间的大小为对应一层计算架构的输入参数的大小，输出参数的大小及计算参数的大小之和，则深度学习系统分配的存储空间的大小与3层计算架构的存储空间中最大存储空间的大小一致。

如果深度学习系统确定的每一层计算架构的存储空间的大小包括：储存输入参数的空间大小，储存计算参数的空间大小及储存输出参数的空间大小，则深度学习系统分配的存储空间的大小为第一最大空间，第二最大空间及第三最大空间的大小之和。其中，第一最大空间为3层计算架构对应的存储空间中储存输入参数的最大空间的大小，第二最大空间为3层计算架构对应的存储空间中储存计算参数的最大空间的大小，第三最大空间为3层计算架构对应的存储空间中储存输出参数的最大空间的大小。

当深度学习系统通过上述步骤401到404为深度学习模型分配一个存储空间后，深度学习系统可以按照如下步骤405到407的方法，循环利用该存储空间。

步骤405，深度学习系统接收用户输入的参数(即输入数据)，将用户输入的参数作为第一层计算架构的输入参数储存到存储空间的第一存储空间，将第一层计算架构的计算参数储存到存储空间的第二存储空间；深度学习系统根据第一层计算架构的输入参数和计算参数计算得到第一层计算架构的输出参数，并将输出参数储存到存储空间的第三存储空间。

步骤406，深度学习系统将第三存储空间的地址指针直接赋给储存第二层计算架构的输入参数的空间，将第一层计算架构的输出参数作为第二层计算架构的输入参数；将第二层存储空间的地址指针直接赋给存储第二层计算架构的计算参数的空间，并将第二层计算架构的计算参数储存到第二层存储空间中；将第一存储空间的地址指针赋给第二层计算架构的输出参数的空间，将根据第二层计算架构的输入参数和计算参数得到的输出参数储存到第一存储空间中。

步骤407，深度学习系统将第一存储空间的地址指针直接赋给储存第三层计算架构的输入参数的空间，将第二层计算架构的输出参数作为第三层计算架构的输入参数；将第二层存储空间的地址指针直接赋给存储第三层计算架构的计算参数的空间，并将第三层计算架构的计算参数储存到第二层存储空间中；将第三存储空间的地址指针赋给第三层计算架构的输出参数的空间，将根据第三层计算架构的输入参数和计算参数得到的输出参数储存到第三存储空间中，则该输出参数为深度学习模型的最终输出参数。

本申请各实施例实施例还提供一种机器学习系统，其结构示意图如图6所示，可以包括：

存储确定单元10，用于分别确定机器学习模型的各层计算架构对应的存储空间的大小；

分配单元11，用于根据所述存储确定单元10确定的各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，使得所述存储空间能储存任一层计算架构运行时所需的信息；

计算单元12，用于所述机器学习模型的各层计算架构分别利用所述分配单元11分配的存储空间进行相应计算。

地，计算单元12，用于将所述某一层计算架构对应的计算参数储存到所述存储空间中的第二存储空间；所述某一层计算架构将所述存储空间中的第一存储空间作为储存对应输入参数的空间，根据所述输入参数和计算参数计算得到输出参数，将所述输出参数储存到所述存储空间中的第三存储空间。

如果所述某一层计算架构为非第一层计算架构，则所述第一存储空间为所述某一层计算架构的前一层计算架构储存输出参数的空间，且所述某一层计算架构的输入参数为所述前一层计算架构的输出参数；所述第三存储空间为所述前一层计算架构储存输入参数的空间。

可见，在本实施例的机器学习系统中，分配单元11会根据机器学习模型的各层计算架构对应的存储空间的大小分配一个存储空间，这样计算单元12的各层计算架构可以循环利用该存储空间。相比现有技术中，需要为各层计算架构分别分配对应的存储空间，本实施例的机器学习系统可以减少因分配多个存储空间而造成的存储碎片，且很大程度地减少了机器学习模型运行时所需的存储空间，从而提升了系统性能，这样就可以将该机器学习系统运行于存储受限的终端设备。

参考图7所示，在一个的实施例中，存储确定单元10可以通过输出确定单元110和最终确定单元120，其中：

输出确定单元110，用于获取所述机器学习模型的配置文件，所述配置文件中包括所述某一层计算架构的计算参数的信息，输入参数的信息及结构信息；根据所述输入参数的信息，计算参数的信息及结构信息确定所述某一层计算架构的输出参数的大小；

最终确定单元120，用于将所述输入参数的大小，输出确定单元110确定的输出参数的大小及计算参数的大小之和作为所述某一层计算架构对应的存储空间的大小；或者，确定所述某一层计算架构对应的存储空间的大小包括：储存所述输入参数的空间大小，储存所述计算参数的空间大小及储存所述输出参数的空间大小。

其中，如果最终确定单元120将所述输入参数的大小，输出参数的大小及计算参数的大小之和作为所述某一层计算架构对应的存储空间的大小则分配单元11用于确定所述各层计算架构对应的存储空间中最大存储空间的大小；分配存储空间，使得所述存储空间的大小与所述最大存储空间的大小一致。

如果最终确定单元120确定所述某一层计算架构对应的存储空间的大小包括：储存所述输入参数的空间大小，储存所述计算参数的空间大小及储存所述输出参数的空间大小，则所述分配单元11，用于确定所述各层计算架构对应的存储空间中储存输入参数的第一最大空间的大小，储存计算参数的第二最大空间的大小及储存输出参数的第三最大空间的大小；分配存储空间，使得所述存储空间的大小是所述第一最大空间，第二最大空间及第三最大空间的大小之和。

本申请各实施例还提供一种计算设备。各实施例中，计算设备可以为不同类型的设备，例如服务器、终端设备(如PC、智能手机、平板电脑，等)、嵌入式设备(如监控设备、考勤设备等)。

各实施例的终端设备的结构如图8所示。该终端设备可因配置或性能不同而产生比较大的差异。该终端设备可以包括一个或一个以上中央处理器(central processing units，CPU)20(例如，一个或一个以上处理器)和存储器21，一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中，存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对终端设备中的一系列指令操作。更进一步地，中央处理器20可以设置为与存储介质22通信，在终端设备上执行存储介质22中的一系列指令操作。

终端设备还可以包括一个或一个以上电源23，一个或一个以上有线或无线网络接口24，一个或一个以上输入输出接口25，和/或，一个或一个以上操作系统223，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

机器学习系统可以存储在存储介质22中，可以是独立的可执行代码，也可以是应用程序或应用程序的一部分。例如，当机器学习系统是相机应用程序的一部分时，机器学习系统可以是用于人脸检测的系统；当机器学习系统是照片美化应用程序的一部分时，机器学习系统可以是用于人脸配准的系统；当机器学习系统是社交应用程序的一部分时，机器学习系统可以是用于语音识别、自然语言处理等的系统，等。

各实施例的嵌入式设备的结构如图9所示。该嵌入式设备为集软硬件于一体的可独立工作的器件。该嵌入式设备可以包括控制器31、随机存取存储器(RAM)321、只读存储器(ROM)322和I/O接口33。控制器31是嵌入式处理器，例如单片机或微控制器(MCU)。ROM 322中存储有用于实现机器学习系统323的指令。其它实施例中，嵌入式设备还可以包括通讯模块、显示模块等。该嵌入式设备可以是监控设备、考勤设备、便携式翻译设备，等。例如，当该嵌入式设备为监控设备时，机器学习系统323可以是用于目标跟踪的系统；当该嵌入式设备为考勤设备时，机器学习系统323可以是用于活体检验的系统；当该嵌入式设备为便携式翻译设备时，机器学习系统323可以是用于语音识别、机器翻译的系统。

各实施例的服务器的结构如图10所示。该服务器可以包括处理器41、存储器42、网络接口43。存储器42中存储有操作系统421，用于通过网络收发信息的网络通信模块422，和机器学习系统423对应的指令。存储器42中还可以存储各种数据，例如机器学习系统423的配置文件，等。

上述方法实施例中所述的由机器学习系统所执行的步骤可以由该图8、9、10中任一设备执行。

图11为本申请实施例的一种使用机器学习系统的场景的示意图。如图11所示，服务器系统51可以通过网络52与终端设备53和数据存储设备54通信。

服务器系统51可以包括一台或多台服务器设备。服务器系统51包括处理器511、存储器512和通信接口514。存储器512中存储有计算机可读指令，可以使处理器511执行机器学习系统513的操作。

一些实施例中，服务器系统511可以执行机器学习系统513对应的指令，从数据存储设备54获取已标记的训练数据，对机器学习系统513进行训练。这个过程也就是，使机器学习系统513利用数据存储设备54中存储的已标记的训练数据进行深度学习，以改善机器学习系统513的性能。当机器学习系统513的性能达到预设要求时，服务器系统511可以将训练后的机器学习系统513提供给终端设备53。

终端设备53可以是PC、智能手机、平板电脑等。机器学习系统513可以作为可执行的代码，或者应用程序的一部分提供给终端设备53。终端设备53将机器学习系统533存储在存储器532中，并在需要时使处理器531执行该机器学习系统533对应的代码，对终端设备53采集的数据进行处理。例如，当机器学习系统533为用于语音识别的系统时，终端设备53可以通过输入设备(如麦克风等)采集语音数据，调用机器学习系统533。机器学习系统533运行时，计算需要分配的存储空间的大小，并在存储器532中获取该大小的存储空间；将上述语音数据存储到该存储空间，作为多层计算架构的输入数据。多层计算架构依次利用分配的该存储空间进行计算，将最终的计算结果输出给调用该机器学习系统533的程序或进程。

例如，当机器学习系统533为用于语音识别的系统时，终端设备53可以通过输入设备(如麦克风等)采集语音数据，调用机器学习系统533。机器学习系统533运行时，计算需要分配的存储空间的大小，并在存储器532中获取该大小的存储空间；将上述语音数据存储到该存储空间，作为多层计算架构的输入数据。多层计算架构依次利用分配的该存储空间进行计算，将最终的计算结果输出给调用该机器学习系统533的程序或进程。

又例如，当机器学习系统533为照片美化应用中的一部分，用于人脸配准时，照片美化应用可以通过终端设备53的输入设备(如摄像头等)采集图像数据，并调用机器学习系统533。机器学习系统533运行时，计算需要分配的存储空间的大小，并在存储器532中获取该大小的存储空间；将上述图像数据存储到该存储空间，作为多层计算架构的输入数据。多层计算架构依次利用分配的该存储空间进行计算，将最终的计算结果(例如图像数据中人脸五官位置信息)输出给照片美化应用。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM)、随机存取存储器RAM)、磁盘或光盘等。

以上对本申请各实施例实施例所提供的机器学习方法及系统进行了详细介绍，本文中应用了个例对本申请各实施例的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请各实施例的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请各实施例的思想，在实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请各实施例的限制。

Claims

一种机器学习方法，其特征在于，应用于计算设备，包括：

分别确定机器学习模型的各层计算架构所需的存储空间的大小；

根据所述各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，使得所述存储空间的大小足够储存任一层计算架构运行时涉及的信息且小于所述各层计算架构所需的存储空间的大小之和；

所述机器学习模型的各层计算架构分别利用所述存储空间进行计算。
如权利要求1所述的方法，其特征在于，确定所述机器学习模型的各层计算架构所需的存储空间的大小包括：

从所述机器学习模型的配置文件中获取一层计算架构的计算参数的信息，输入参数的信息及结构信息；

根据所述输入参数的信息，计算参数的信息及结构信息确定所述某一层计算架构的输出参数的大小；

根据所述计算参数的信息确定该层计算架构储存所述输入参数所需的存储空间的大小、储存所述计算参数所需的存储空间的大小、及储存所述输出参数所需的存储空间的大小。
如权利要求1所述的方法，其特征在于，所述根据所述各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，包括：

确定所述各层计算架构所需的存储空间中最大存储空间的大小；

分配所述存储空间，使得所述存储空间的大小与所述最大存储空间的大小一致。
如权利要求1所述的方法，其特征在于，所述根据所述各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，包括：

确定所述各层计算架构对应的存储空间中储存输入参数所需的存储空间大小的第一最大值，储存计算参数所需的存储空间大小的第二最大值及储存输出参数所需的存储空间大小的第三最大值；

分配所述存储空间，使得所述存储空间的大小是所述第一最大值，第二最大值及第三最大值之和。
如权利要求1所述的方法，其特征在于，所述机器学习模型的各层计算架构分别利用所述存储空间进行计算包括：

将第一层计算架构的第一输出数据写入所述存储空间；

将所述第一输出数据作为第二层计算架构的输入数据，利用所述存储空间执行所述第二层计算架构的计算；

将所述第二层计算架构的第二输出数据写入所述存储空间。
如权利要求5所述的方法，其特征在于，将所述第一输出数据作为第二层计算架构的输入数据，利用所述存储空间执行所述第二层计算架构的计算包括：

将所述第一输出数据的存储位置提供给所述第二层计算架构；

所述第二层计算架构从所述存储位置读取所述第一输出数据作为所述输入数据，并将计算结果作为所述第二输出数据写入所述存储空间。
如权利要求1所述的方法，其特征在于，所述机器学习模型的各层计算架构分别利用所述存储空间进行计算包括：

将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间；

将所述第一层计算架构计算得到的第一输出数据储存到所述存储空间中的第二存储空间；

将所述第二存储空间中存储的所述第一输出数据作为第二层计算架构的输入数据，将所述第二层计算架构计算得到的第二输出数据存储到所述第一存储空间；

将所述第一存储空间中存储的所述第二输出数据作为第三层计算架构的输入数据。
如权利要求1所述的方法，其特征在于，所述机器学习模型的各层计算架构分别利用所述存储空间进行计算包括：

将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间；

将所述第一层计算架构的计算参数储存到所述存储空间中的第二存储空间；

将所述第一层计算架构根据所述输入数据和所述计算参数计算得到的第一输出数据储存到所述存储空间中的第三存储空间；

将所述第三存储空间中存储的数据作为第二层计算架构的输入数据，将所述第二层计算架构计算得到的第二输出数据存储到所述第一存储空间或所述第二存储空间；

将所述第一存储空间或所述第二存储空间中存储的所述第二输出数据作为第三层计算架构的输入数据。
一种计算设备，其特征在于，包括：处理器和存储器，所述存储器中存储有机器可读指令，可以使所述处理器：

分别确定机器学习模型的各层计算架构所需的存储空间的大小；

根据所述各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，使得所述存储空间的大小足够能储存任一层计算架构运行时涉及的信息且小于所述各层计算架构所需的存储空间的大小之和；

所述机器学习模型的各层计算架构分别利用所述存储空间进行计算。
如权利要求9所述的计算设备，其特征在于，所述机器可读指令可以使所述处理器：

获取所述机器学习模型的配置文件，所述配置文件中包括所述某一层计算架构的计算参数的信息，输入参数的信息及结构信息；

根据所述输入参数的信息，计算参数的信息及结构信息确定所述某一层计算架构的输出参数的大小；

根据所述计算参数的信息确定该层计算架构储存所述输入参数所需的存储空间的大小、储存所述计算参数所需的存储空间的大小、及储存所述输出参数所需的存储空间的大小。
如权利要求9所述的计算设备，其特征在于，所述机器可读指令可以使所述处理器：

确定所述各层计算架构对应的存储空间中最大存储空间的大小；

分配所述存储空间，使得所述存储空间的大小与所述最大存储空间的大小一致。
如权利要求9所述的计算设备，其特征在于，所述机器可读指令可以使所述处理器：

确定所述各层计算架构对应的存储空间中储存输入参数所需的存储空间大小的第一最大值，储存计算参数所需存储空间大小的第二最大值及储存输出参数所需存储空间大小的第三最大值；

分配所述存储空间，使得所述存储空间的大小是所述第一最大值、第二最大值及第三最大值之和。
如权利要求9所述的计算设备，其特征在于，所述机器可读指令可以使所述处理器：

将第一层计算架构的第一输出数据写入所述存储空间；

将所述第一输出数据作为第二层计算架构的输入数据，利用所述存储空间执行所述第二层计算架构的计算；

将所述第二层计算架构的第二输出数据写入所述存储空间。
如权利要求9所述的计算设备，其特征在于，所述机器可读指令可以使所述处理器：

将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间；

将所述第一层计算架构计算得到的第一输出数据储存到所述存储空间中的第二存储空间；

将所述第二存储空间中存储的所述第一输出数据作为第二层计算架构的输入数据，将所述第二层计算架构计算得到的第二输出数据存储到所述第一存储空间；

将所述第一存储空间中存储的所述第二输出数据作为第三层计算架构的输入数据。
如权利要求9所述的计算设备，其特征在于，所述机器可读指令可以使所述处理器：

将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间；

将所述第一层计算架构的计算参数储存到所述存储空间中的第二存储空间；

将所述第一层计算架构根据所述输入数据和所述计算参数计算得到的第一输出数据储存到所述存储空间中的第三存储空间；

将所述第三存储空间中存储的数据作为第二层计算架构的输入数据，将所述第二层计算架构计算得到的第二输出数据存储到所述第一存储空间或所述第二存储空间；

将所述第一存储空间或所述第二存储空间中存储的所述第二输出数据作为第三层计算架构的输入数据。
一种机器可读存储介质，其特征在于，存储有机器可读指令，所述指令可以由处理器执行用于：

分别确定机器学习模型的各层计算架构所需的存储空间的大小；

根据所述各层计算架构的存储空间的大小为所述机器学习模型分配对应的存储空间，使得所述存储空间的大小足够储存任一层计算架构运行时涉及的信息且小于所述各层计算架构所需的存储空间的大小之和；

所述机器学习模型的各层计算架构分别利用所述存储空间进行计算。
如权利要求16所述的存储介质，其特征在于，所述指令可以由处理器执行用于：

获取所述机器学习模型的配置文件，所述配置文件中包括所述某一层计算架构的计算参数的信息，输入参数的信息及结构信息；

根据所述输入参数的信息，计算参数的信息及结构信息确定所述某一层计算架构的输出参数的大小；

根据所述计算参数的信息确定该层计算架构储存所述输入参数所需的存储空间的大小、储存所述计算参数所需的存储空间的大小、及储存所述输出参数所需的存储空间的大小。
如权利要求16所述的存储介质，其特征在于，所述指令可以由处理器执行用于：

确定所述各层计算架构对应的存储空间中最大存储空间的大小；

分配所述存储空间，使得所述存储空间的大小与所述最大存储空间的大小一致。
如权利要求16所述的存储介质，其特征在于，所述指令可以由处理器执行用于：

确定所述各层计算架构对应的存储空间中储存输入参数所需的存储空间大小的第一最大值，储存计算参数所需存储空间大小的第二最大值及储存输出参数所需存储空间大小的第三最大值；

分配所述存储空间，使得所述存储空间的大小是所述第一最大值、第二最大值及第三最大值之和。
如权利要求16所述的存储介质，其特征在于，所述指令可以由处理器执行用于：

将第一层计算架构的第一输出数据写入所述存储空间；

将所述第一输出数据作为第二层计算架构的输入数据，利用所述存储空间执行所述第二层计算架构的计算；

将所述第二层计算架构的第二输出数据写入所述存储空间。
如权利要求16所述的存储介质，其特征在于，所述指令可以由处理器执行用于：

将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间；

将所述第一层计算架构计算得到的第一输出数据储存到所述存储空间中的第二存储空间；

将所述第二存储空间中存储的所述第一输出数据作为第二层计算架构的输入数据，将所述第二层计算架构计算得到的第二输出数据存储到所述第一存储空间；

将所述第一存储空间中存储的所述第二输出数据作为第三层计算架构的输入数据。
如权利要求16所述的存储介质，其特征在于，所述指令可以由处理器执行用于：

将第一层计算架构的输入数据存储到所述存储空间中的第一存储空间；

将所述第一层计算架构的计算参数储存到所述存储空间中的第二存储空间；

将所述第一层计算架构根据所述输入数据和所述计算参数计算得到的第一输出数据储存到所述存储空间中的第三存储空间；

将所述第三存储空间中存储的数据作为第二层计算架构的输入数据，将所述第二层计算架构计算得到的第二输出数据存储到所述第一存储空间或所述第二存储空间；

将所述第一存储空间或所述第二存储空间中存储的所述第二输出数据作为第三层计算架构的输入数据。