WO2019233231A1

WO2019233231A1 - 通用机器学习模型、模型文件的生成和解析方法

Info

Publication number: WO2019233231A1
Application number: PCT/CN2019/085853
Authority: WO
Inventors: 杜伟健; 吴林阳; 陈峋宇
Original assignee: 上海寒武纪信息科技有限公司
Priority date: 2018-06-08
Filing date: 2019-05-07
Publication date: 2019-12-12
Also published as: EP3751477A4; US11334330B2; US11403080B2; US11307836B2; US20210109728A1; US20210109725A1; US11334329B2; US11726754B2; US20210109726A1; KR20210017985A; US20210089285A1; US20220326919A1; US20210109729A1; US11036480B2; JP7386706B2; JP2021526670A; EP3751477A1; US20210109727A1; US11379199B2

Abstract

一种通用机器学习模型的生成方法、装置、计算机设备和存储介质。该方法包括：获取机器学习任务的任务参数（S1201）；对任务参数进行分类处理，得到任务指令及模型参数（S1202）；根据数据类型将任务指令及模型参数进行汇集，得到栈数据和堆数据（S1203）；将栈数据和堆数据进行整合，得到通用机器学习模型（S1204）。采用该方法能够使得算法运行中直接执行相应通用模型的编译结果，避免重复编译，从而大大提高机器学习算法实现的效率，缩短了从编译到得到执行结果的时间。

Description

通用机器学习模型、模型文件的生成和解析方法

相关申请

本申请要求2018年11月30日申请的，申请号为201811459853.6，名称为“通用机器学习模型文件解析方法、装置、存储介质”；申请号为201811459679.5，名称为“通用机器学习模型文件的生成方法、装置、存储介质”；申请号为201811457719.2，名称为“机器学习二级模型文件生成方法、装置、存储介质”；申请号为201811456246.4，名称为“通用机器学习二级模型文件解析方法、装置、存储介质”的中国专利申请的优先权；2018年6月8日申请的，申请号为201810589390.9，名称为“通用机器学习模型的生成方法、装置和存储介质”；以及申请号为201810588623.3，名称为“通用机器学习模型的执行方法、装置和存储介质”的中国专利申请的优先权，在此将其全文引入作为参考。

技术领域

本申请涉及一种人工智能领域，特别是涉及一种通用机器学习模型、模型文件的生成方法、装置和存储介质。

背景技术

随着人工智能技术的发展，出现了各种机器学习算法。传统的机器学习算法在开发平台中运行时，每次执行都要先经过编译过程。但是由于机器学习过程中，算法重复编译次数多，而编译过程耗时长，导致算法执行效率低。

发明内容

有鉴于此，本申请公开一种机器学习模型的生成、执行以及使用方法、装置和存储介质，以实现在机器学习运算过程中，根据运算需要直接在通用机器学习模型文件中读取对应的通用模型，避免重复编译，从而大大提高机器学习算法实现的效率，缩短了从编译到得到执行结果的时间。

一种通用机器学习模型的生成方法，所述方法包括：

获取机器学习任务的任务参数；

对所述任务参数进行分类处理，得到任务指令及模型参数；

根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据；

将所述栈数据和堆数据进行整合，得到通用机器学习模型。

在其中一个实施例中，所述任务参数包括算法控制参数和计算参数；

所述对所述任务参数进行分类处理，得到任务指令及模型参数的步骤包括：

对所述算法控制参数进行编译，得到任务指令；

对所述计算参数进行分类处理，得到模型参数。

在其中一个实施例中，所述对所述计算参数进行分类处理，得到模型参数的步骤包括：

对所述计算参数进行预处理，得到预处理模型数据；

根据所述计算参数获取硬件参数；

提取所述计算参数中的数据属性参数。

在其中一个实施例中，所述根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据的步骤包括：

对所述任务指令进行分类处理，得到任务指令堆数据；

根据所述数据类型对模型参数进行分类处理，得到模型参数栈数据及模型参数堆数据；

对所述模型参数栈数据进行汇集，得到所述栈数据；

对所述模型参数堆数据进行汇集，得到所述堆数据。

在其中一个实施例中，所述根据所述数据类型对模型参数进行分类处理，得到模型参数栈数据及模型参数堆数据的步骤包括：

根据共享属性对所述模型参数进行分类，得到可共享模型参数及不可共享模型参数；

对可共享模型参数进行汇集，得到模型参数堆数据；

对所述不可共享模型参数进行汇集，得到模型参数栈数据。

在其中一个实施例中，所述模型参数堆数据包括模型参数静态数据和模型参数动态数据；

所述将所述栈数据和堆数据进行整合，得到通用机器学习模型的步骤包括：

将所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到连续的静态数据块；

对所述模型参数动态数据进行打包整合，得到连续的动态数据块；

对所述模型参数栈数据进行打包整合，得到栈数据块；

对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型。

在其中一个实施例中，所述对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型的步骤包括：

根据所述任务指令获取静态数据布局信息、动态数据布局信息以及栈数据布局信息；

根据所述静态数据布局信息对所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到所述连续的静态数据块；

根据所述动态数据布局信息对对所述模型参数动态数据进行打包整合，得到连续的动态数据块；

根据所述栈数据布局信息对所述模型参数栈数据进行打包整合，得到所述栈数据块；

对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行整合。

在其中一个实施例中，所述提取所述计算参数中的数据属性参数的步骤包括：

获取计算参数的输入数据属性、输出数据属性及中间结果临时空间属性；

在所述输入数据的属性中提取所述输入数据的数据量，并分配所述输入数据存储空间；

在所述输出数据的属性中提取所述输出数据的数据量，并分配所述输出数据存储空间；

在所述中间结果临时空间属性中提取中间结果临时空间的数据量，并分配所述中间结果临时存储空间

将所述输入数据存储空间及输出数据存储空间存储为堆数据，将所述中间结果临时空间存储为栈数据。

在其中一个实施例中，所述根据所述栈数据布局信息对所述模型参数栈数据进行打包整合，得到所述栈数据块的步骤包括：

根据所述栈数据布局信息对所述不可共享模型参数、中间结果临时空间数据进行整合，得到所述栈数据块。

在其中一个实施例中，所述根据所述计算参数获取硬件参数的步骤包括：

获取硬件平台信息以及硬件配置参数并存储为堆数据。

在其中一个实施例中，所述根据所述静态数据布局信息对所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到所述连续的静态数据块的步骤包括：

根据所述静态数据布局信息，对所述任务指令堆数据、可共享模型参数、硬件平台信息以及硬件配置参数进行整合，得到所述连续的静态数据块。

在其中一个实施例中，所述根据所述动态数据布局信息对所述模型参数动态数据进行打包整合，得到连续的动态数据块的步骤包括：

根据所述动态数据布局信息对所述输入数据存储空间以及所述输出数据存储空间进行整合，得到所述连续的动态数据块。

一种通用机器学习模型的生成装置，所述装置包括：

对外接口模块，用于获取机器学习任务的任务参数；

分类处理模块，用于对所述任务参数进行分类处理，得到任务指令及模型参数；

参数汇集模块，用于根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据；

模型生成模块，用于将所述栈数据和堆数据进行整合，得到通用机器学习模型。

所述分类处理模块包括：

任务指令生成模块，用于对所述算法控制参数进行编译，得到任务指令；

模型参数生成模块，对所述计算参数进行分类处理，得到模型参数。

在其中一个实施例中，所述模型参数生成模块包括：

模型参数栈数据生成模块，用于对可共享模型参数进行汇集，得到模型参数栈数据；

模型参数堆数据生成模块，用于对所述不可共享模型参数进行汇集，得到模型参数堆数据。

在其中一个实施例中，所述模型参数堆数据生成模块包括：

模型参数静态数据生成模块，用于对静态的所述模型参数堆数据进行汇集，得到模型参数静态数据；

模型参数动态数据生成模块，用于对动态的所述模型参数堆数据进行汇集，得到模型参数动态数据。

在其中一个实施例中，所述模型参数生成模块还包括：

预处理模块，用于对所述计算参数进行预处理，得到预处理模型数据；

硬件参数生成模块，用于根据所述计算参数获取硬件参数；

属性提取模块，用于提取所述计算参数中的数据属性参数。

在其中一个实施例中，所述任务指令包括任务指令堆数据；所述参数汇集器包括：

栈数据汇集器，用于对所述模型参数栈数据进行打包整合，得到栈数据块；

模型参数动态数据汇集器，用于对所述模型参数动态数据进行打包整合，得到连续的动态数据块；

模型参数静态数据汇集器，用于将所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到连续的静态数据块。

在其中一个实施例中，所述模型生成模块用于对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以上任一实施例所提供方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以上任一实施例所提供方法的步骤。

一种通用机器学习模型的执行方法，所述方法包括：

获取通用机器学习模型；

对所述通用机器学习模型进行分类拆解，得到栈区数据和堆区数据；

根据所述栈区数据、所述堆区数据以及输入数据进行计算，得到输出数据。

本申请实施例还提供了一种通用机器学习模型的执行装置，所述装置包括：

模型获取模块，用于获取通用机器学习模型；

模型拆解模块，用于对所述通用机器学习模型进行分类拆解，得到栈区数据和堆区数据；

结果输出模块，用于获取所述栈区数据和所述堆区数据、以及输入数据进行计算，得到输出数据。

在其中一个实施例中，所述栈区数据包括栈数据，所述堆区数据包括堆数据；所述对所述通用机器学习模型进行分类拆解，得到栈数据和堆数据的步骤包括：

将所述通用机器学习模型中可共享的数据拆解为栈数据；

将所述栈数据分配到栈区；

将所述通用机器学习模型中不可共享的数据拆解为堆数据；

将所述堆数据分配到堆区。

在其中一个实施例中，所述栈数据包括模型参数栈数据，所述栈区数据包括多个栈区中的数据；

所述将所述栈数据分配到栈区，得到栈区数据的步骤包括：

将所述模型参数栈数据分配到模型参数栈区。

在其中一个实施例中，所述将所述模型参数栈数据分配到模型参数栈区的步骤包括：

计算所述模型参数栈数据所需占用存储空间的大小与所述中间结果临时存储空间的大小之和，得到第一存储空间的大小；

分配所述模型参数栈区的存储空间，所述模型参数栈区的存储空间大于或等于所述第一存储空间的大小。

在其中一个实施例中，所述方法还包括：

将运行阶段变化的堆数据存储为模型参数动态数据；以及

将运行阶段不变的堆数据存储为模型参数静态数据。

在其中一个实施例中，所述将所述堆数据分配到堆区的步骤包括：

所述将所述堆数据分配到堆区的步骤包括：

将所述堆区分为模型参数动态堆区和模型参数静态堆区；

将所述模型参数动态数据分配到所述模型参数动态堆区；

将所述模型参数静态数据分配到所述模型参数静态堆区。

在其中一个实施例中，所述将所述模型参数动态数据分配到模型参数动态堆区的步骤包括：

将所述模型参数动态数据的存储空间与所述输入数据的存储空间、所述输出数据的存储空间相加，得到第二存储空间的大小；

分配所述模型参数动态堆区的存储空间，所述动态数据堆区的存储空间大于或等于所述第二存储空间的大小。

在其中一个实施例中，所述模型参数静态堆区的存储空间大于等于所述模型参数静态数据的存储空间。

在其中一个实施例中，所述模型参数静态数据包括任务指令堆数据。

在其中一个实施例中，所述将所述堆数据分配到堆区，得到堆区数据的步骤还包括：

所述将所述堆数据分配到堆区的步骤还包括：

将所述模型参数动态堆区、所述模型参数静态堆区分配到一段连续的存储空间。

在其中一个实施例中，所述堆区中的数据包括所述模型参数动态数据、所述模型参数静态数据以及所述输入数据、所述输出数据。

在其中一个实施例中，所述根据所述栈区数据、所述堆区数据和所述输入数据进行计算，得到输出数据的步骤还包括：

从所述堆区提取所述输出数据；

输出所述输出数据。

一种通用机器学习模型的执行装置，其特征在于，所述装置包括：

模型获取模块，用于获取通用机器学习模型；

在其中一个实施例中，所述栈区数据包括栈数据，所述堆区数据包括堆数据；所述模型拆解模块包括：

栈区数据分配模块，用于将所述通用机器学习模型中不可共享的数据拆解为栈数据；

堆区数据分配模块，用于将所述通用机器学习模型中可共享的数据拆解为堆数据。

在其中一个实施例中，所述栈区数据分配模块还用于将所述栈数据分配到栈区。

在其中一个实施例中，所述堆区数据分配模块还用于将所述堆数据分配到堆区。

在其中一个实施例中，所述栈数据包括模型参数栈数据；所述栈数据分配模块还用于将所述模型参数栈数据分配到模型参数栈区。

在其中一个实施例中，所述堆数据包括模型参数静态数据以及模型参数动态数据；所述堆数据分配模块还包括：

模型参数静态数据分配模块，用于将所述模型参数静态数据分配到模型参数静态堆区；

模型参数动态数据分配模块，用于将所述模型参数动态数据分配到模型参数动态堆区。

在其中一个实施例中，所述结果输出模块还包括：

数据提取模块，用于从所述堆区提取所述输出数据；

数据输出模块，用于输出所述输出数据。

一种通用机器学习模型文件的生成方法，所述通用机器学习模型文件包括通用机器学习模型和模型目录，所述生成方法包括：

获取所述通用机器学习模型；

计算所述通用机器学习模型的存储偏移量；

根据所述通用机器学习模型以及所述通用机器学习模型存储偏移量，生成所述模型目录；

根据所述通用机器学习模型以及所述模型目录，生成所述通用机器学习模型文件。

在其中一个实施例中，所述根据所述通用机器学习模型以及所述模型目录，生成所述通用机器学习模型文件，包括：

获取所述通用机器学习模型文件的文件头和文件尾；

根据所述文件头、所述模型目录、所述通用机器学习模型以及所述文件尾，生成所述通用机器学习模型文件。

在其中一个实施例中，所述计算所述通用机器学习模型的存储偏移量的步骤包括：

获取每个所述通用机器学习模型占用的存储空间大小和所述通用机器学习模型的数量；

获取所述通用机器学习模型的存放顺序；

根据每个所述通用机器学习模型占用的存储空间大小、所述通用机器学习模型的数量、所述通用机器学习模型的存放顺序，计算每个所述通用机器学习模型的存储偏移量。

在其中一个实施例中，所述根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件，包括：

所述根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件，包括：

创建所述通用机器学习模型文件的标识码；

根据所述标识码、所述通用机器学习模型、所述模型目录，生成所述通用机器学习模型文件。

在其中一个实施例中，所述根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件，还包括：

所述根据所述通用机器学习模型以及所述模型目录，生成所述通用机器学习模型文件，包括：

创建所述通用机器学习模型文件的校验码和/或纠错码；

根据所述通用机器学习模型文件的校验码和/或纠错码、所述通用机器学习模型以及所述模型目录，生成所述通用机器学习模型文件。

创建所述通用机器学习模型文件的纠错码；

根据所述通用机器学习模型文件的纠错码、所述通用机器学习模型、所述模型目录，生成通用机器学习模型文件。

在其中一个实施例中，所述根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件还包括：

计算所述通用机器学习模型文件所需占用的存储空间的大小；

根据所述通用机器学习模型、所述通用机器学习模型文件所需占用的存储空间的大小以及所述模型目录，生成通用机器学习模型文件。

一种通用机器学习模型文件生成方法，所述方法包括：

获取机器学习任务的任务参数；

对所述任务参数进行分类处理，生成任务指令及模型参数；

根据数据类型将所述任务指令及模型参数进行汇集，生成栈数据和堆数据；

将所述栈数据和堆数据进行整合，生成通用机器学习模型；

计算所述通用机器学习模型的存储偏移量；

根据所述通用机器学习模型以及所述通用机器学习模型存储偏移量，生成模型目录；

根据所述通用机器学习模型、所述模型目录，生成通用机器学习模型文件。

一种通用机器学习模型文件的生成装置，所述通用机器学习模型文件包括通用机器学习模型和模型目录，所述生成装置包括：

模型填充器、目录生成器以及文件生成器；所述模型填充器和所述目录生成器相连，所述文件生成器分别与所述模型填充器、所述目录生成器相连；

所述模型填充器，用于获取所述通用机器学习模型；

所述目录生成器，用于计算所述通用机器学习模型的存储偏移量；以及

所述文件生成器用于根据所述通用机器学习模型、所述模型目录，生成所述通用机器学习模型文件。

在其中一个实施例中，所述模型填充器还用于将所述通用机器学习模型，按序存入所述文件生成器。

在其中一个实施例中，所述文件生成器还包括文件头生成器和所述文件尾生成器；所述文件头生成器与所述目录生成器相连，所述文件尾生成器与所述模型填充器相连。

在其中一个实施例中，所述文件头生成器还用于创建通用机器学习模型文件的标识码，以及根据所述通用机器学习模型文件的标识码、所述通用机器学习模型、所述模型目录，生成所述通用机器学习模型文件。

在其中一个实施例中，所述文件尾生成器还用于创建所述通用机器学习模型文件的校验码和/或纠错码。

在其中一个实施例中，所述生成装置还包括文件大小计算器，所述文件大小计算器与所述目录生成器连接，用于计算所述通用机器学习模型占用的存储空间大小，以及计算所述通用机器学习模型文件所需占用的存储空间的大小。

一种通用机器学习模型文件生成装置，所述生成装置包括：

对外接口模块，用于获取机器学习任务的任务参数；

分类处理模块，用于对所述任务参数进行分类处理，生成任务指令及模型参数；

参数汇集模块，用于根据数据类型将所述任务指令及模型参数进行汇集，生成栈数据和堆数据；

模型生成模块，用于将所述栈数据和堆数据进行整合，生成通用机器学习模型；

存储偏移量计算模块，用于计算所述通用机器学习模型的存储偏移量；

模型目录生成模块，用于根据所述通用机器学习模型以及所述通用机器学习模型存储偏移量，生成所述模型目录；

模型文件生成模块，用于根据所述通用机器学习模型、所述模型目录，生成所述通用机器学习模型文件。

在其中一个实施例中，所述文件大小计算器与模型存储优化器相连。一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以上任一实施例所述方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以上任一实施例所述方法的步骤。

一种机器学习二级模型文件的生成方法，所述机器学习二级模型文件包括二级模型和二级模型目录，所述生成方法包括：

获取通用机器学习模型；

对所述通用机器学习模型进行存储优化处理，生成所述二级模型；

计算所述二级模型的存储偏移量；

根据所述二级模型以及所述二级模型的存储偏移量，生成二级模型目录；

根据所述二级模型以及所述二级模型目录，生成机器学习二级模型文件。

在其中一个实施例中，所述对所述通用机器学习模型进行存储优化处理，生成所述二级模型的步骤包括：对所述通用机器学习模型进行压缩处理和/或加密处理，生成所述二级模型。

在其中一个实施例中，所述根据所述二级模型以及所述二级模型目录，生成机器学习二级模型文件，包括：

获取所述机器学习二级模型文件的文件头和文件尾；

根据所述文件头、所述二级模型目录、所述通用机器学习模型以及所述文件尾，生成所述机器学习二级模型文件。

在其中一个实施例中，所述计算所述二级模型的存储偏移量的步骤包括：

获取每个所述通用机器学习模型占用的存储空间大小和所述二级模型的数量；

获取所述二级模型的存放顺序；

根据每个所述二级模型占用的存储空间大小、所述二级模型的数量、所述二级模型的存放顺序，计算每个所述二级模型的存储偏移量。

在其中一个实施例中，所述根据所述通用机器学习模型以及所述模型目录，生成机器学习二级模型文件，包括：

创建机器学习二级模型文件的标识码；

根据所述模型文件的标识码、所述二级模型、所述二级模型目录，生成机器学习二级模型文件。

在其中一个实施例中，所述根据所述二级模型以及所述模型目录，生成机器学习二级模型文件，包括：

创建所述机器学习二级模型文件的校验码和/或纠错码；根据所述机器学习二级模型文件的校验码和/或纠错码、所述二级模型以及所述二级模型目录，生成机器学习二级模型文件。

一种通用机器学习模型文件生成方法，所述方法包括：

获取机器学习任务的任务参数；

对所述任务参数进行分类，生成任务指令及模型参数；

将所述栈数据和堆数据进行整合，生成通用机器学习模型；

对所述通用机器学习模型进行存储优化处理，生成所述二级模型；计算所述二级模型的存储偏移量；

根据所述二级模型以及所述二级模型存储偏移量，生成二级模型目录；

根据所述二级模型、所述模型目录，生成机器学习二级模型文件。

一种机器学习二级模型文件的生成装置，所述机器学习二级模型文件包括二级模型和二级模型目录所述生成装置包括：

二级模型填充器、模型存储优化器、目录生成器以及文件生成器；所述模型填充器和所述目录生成器相连，所述文件生成器分别与所述模型填充器、所述目录生成器相连，所述模型存储优化器与所述模型填充器相连；

所述二级模型填充器，用于获取通用机器学习模型；

所述模型存储优化器，用于对所述通用机器学习模型进行存储优化处理，生成二级模型；

所述目录生成器用于计算所述通用机器学习模型的存储偏移量；以及根据所述二级模型以及所述二级模型存储偏移量，生成二级模型目录；

所述文件生成器用于根据所述二级模型、所述二级模型目录，生成机器学习二级模型文件。

在其中一个实施例中，所述二级模型填充器还用于将所述二级模型，按序存入所述文件生成器。

在其中一个实施例中，所述文件生成器还包括文件头生成器和所述文件尾生成器；所述文件头生成器与所述目录生成器相连，所述文件尾生成器与所述二级模型填充器相连。

在其中一个实施例中，所述文件头生成器还用于创建二级模型的标识码，以及根据所述标识码、所述二级模型、所述二级模型目录，生成机器学习二级模型文件。

在其中一个实施例中，所述文件尾生成器还用于创建所述机器学习二级模型文件的校验码和/或纠错码。

在其中一个实施例中，所述生成装置还包括文件大小计算器，所述文件大小计算器与所述目录生成器连接，用于计算所述通用机器学习模型占用的存储空间大小，以及计算所述模型文件所需占用的存储空间的大小。

在其中一个实施例中，所述文件大小计算器与模型存储优化器相连。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以上任一实施例所述方法的步骤。

一种通用机器学习模型文件解析方法，所述通用机器学习模型文件包括通用机器学习模型、二级模型目录，所述方法包括：

所述方法包括：

获取通用机器学习模型文件；

在所述通用机器学习模型文件中读取二级模型目录；

根据所述二级模型目录，读取目标二级模型；

对所述目标二级模型进行还原得到目标通用机器学习模型。

在其中一个实施例中，所述获取通用机器学习模型文件包括：

获取所述通用机器学习模型文件的标识码；

检测所述标识码是否符合预设规则；

若所述标识码符合预设规则，则在所述通用机器学习模型文件中读取二级模型目录。

在其中一个实施例中，所述若所述标识码符合预设规则，则在所述通用机器学习模型文件中读取模型目录包括：

获取所述通用机器学习模型文件的校验码；

校验所述校验码与预设标准码是否一致，若所述校验码与预设标准码不一致，则执行纠错运算。

在其中一个实施例中，所述校验码与预设标准码是否一致，若所述校验码与预设标准码不一致，则执行纠错运算包括：

获取纠错码；

根据所述纠错码对所述通用机器学习模型文件进行纠错，得到纠错后的模型文件；

校验所述纠错后的通用机器学习模型文件的校验码与所述预设标准码是否一致；

若所述纠错后的通用机器学习模型文件的校验码与所述预设标准码一致，则在所述通用机器学习模型文件中读取二级模型目录。

在其中一个实施例中，所述根据所述二级模型目录，读取目标二级模型包括：

获取目标二级模型在所述通用机器学习模型文件中的存储偏移量；

根据所述存储偏移量，读取所述目标通用机器学习模型。

在其中一个实施例中，所述方法还包括：

读取所述通用机器学习模型中的硬件参数信息；

根据所述硬件参数信息，生成硬件匹配信息。

在其中一个实施例中，所述方法还包括：

根据所述栈区数据、所述堆区数据以及输入数据计算，得到输出数据。

一种通用机器学习模型文件解析装置，所述通用机器学习模型文件包括通用机器学习模型、二级模型目录，其特征在于，所述装置包括：

文件获取器，模型分发器、目录解析器以及模型读取器；所述目录解析器分别与所述文件获取器、所述模型分发器以及所述模型读取器相连；

所述文件获取器，用于获取通用机器学习模型文件；

所述模型分发器，用于在所述通用机器学习模型文件中读取二级模型目录；并根据所述二级模型目录，读取目标二级模型；以及对所述目标二级模型进行还原得到目标通用机器学习模型；

所述目录解析器，用于在所述通用机器学习模型文件中读取模型目录；

所述模型读取器，用于根据所述模型目录，读取目标通用机器学习模型一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以上任一实施例所述方法的步骤。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以上任一实施例所述方法的步骤

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以以上任一实施例所述方法的步骤。

一种通用机器学习模型文件解析方法，所述方法包括：

获取通用机器学习模型文件；

在所述通用机器学习模型文件中读取模型目录；

根据所述模型目录，读取目标通用机器学习模型。

获取所述通用机器学习模型文件的文件标识码；

检测所述文件标识码是否符合预设规则；

若所述文件标识码符合预设规则，则在所述通用机器学习模型文件中读取模型目录。

在其中一个实施例中，所述若所述文件标识码符合预设规则，则在所述通用机器学习模型文件中读取模型目录包括：

获取所述通用机器学习模型文件的校验码；

在其中一个实施例中，所述纠错运算包括：

所述校验所述校验码与预设标准码是否一致，若所述校验码与预设标准码不一致，则执行纠错运算包括：

获取纠错码；

校验所述纠错后的模型文件的校验码与所述预设标准码是否一致；

若所述纠错后的通用机器学习模型文件的校验码与所述预设标准码一致，则在所述通用机器学习模型文件中读取模型目录。

在其中一个实施例中，所述根据所述模型目录，读取对应的通用机器学习模型包括：

获取目标通用机器学习模型的在所述通用机器学习模型文件中的存储偏移量；

根据所述存储偏移量，读取所述目标通用机器学习模型。

一种通用机器学习模型文件解析方法，所述方法包括：

获取通用机器学习模型文件；

在所述通用机器学习模型文件中读取二级模型目录；

根据所述二级模型目录，读取目标二级模型；

对所述目标二级模型进行还原得到目标通用机器学习模型。

在其中一个实施例中，所述方法还包括：

读取所述通用机器学习模型中的硬件参数信息；

根据所述硬件参数信息，生成硬件匹配信息。

在其中一个实施例中，所述方法还包括：

一种通用机器学习模型文件解析装置，所述装置包括：

文件获取器，目录解析器以及模型读取器；所述目录解析器分别与所述文件获取器、以及所述模型读取器相连；

所述文件获取器，用于获取通用机器学习模型文件；

所述模型读取器，用于根据所述模型目录，读取目标通用机器学习模型。

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据公开的附图获得其他的附图。

图1为一个实施例中通用机器学习模型生成方法的应用环境图；

图2为一个实施例中通用机器学习模型生成方法的流程示意图；

图3为一个实施例中通用机器学习模型生成装置的示意图；

图4为另一个实施例中通用机器学习模型执行方法的流程示意图；

图5为一个实施例中通用机器学习模型执行装置的示意图；

图6为一个实施例中通过通用机器学习模型对jpg图片进行特征提取的流程示意图；

图7为一个实施例中提供的计算机设备的内部结构图；

图8为一个实施例中通用机器学习模型文件生成方法的应用环境图；

图9为一个实施例中通用机器学习模型生成方法的流程示意图；

图10为一个实施例中通用机器学习模型生成装置的结构示意图；

图11为一个实施例中通用机器学习模型文件生成方法的流程示意图；

图12为一个实施例中计算所述通用机器学习模型的存储偏移量的流程示意图；

图13为一个实施例中根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件的流程示意图；

图14为另一个实施例中根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件的流程示意图；

图15为再一个实施例中根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件的流程示意图；

图16为又一个实施例中根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件的流程示意图；

图17为另一个实施例中通用机器学习模型生成方法的流程示意图；

图18为再一个实施例中通用机器学习模型生成方法的流程示意图；

图19为一个实施例中通用机器学习模型文件生成装置的结构示意图；

图20为另一个实施例中通用机器学习模型文件生成装置的结构示意图；

图21为一个实施例中通用机器学习模型解析方法的流程示意图；

图22为一个实施例中获取通用机器学习模型文件流程示意图；

图23为一个实施例中获取通用机器学习模型文件流程示意图；

图24为一个实施例中执行纠错运算流程示意图；

图25为一个实施例中根据所述模型目录，读取目标通用机器学习模型流程示意图；

图26为一个实施例中通用机器学习模型解析方法的流程示意图；

图27为另一个实施例中通用机器学习模型解析方法的流程示意图；

图28为又一个实施例中通用机器学习模型解析方法的流程示意图；

图29为一个实施例中通用机器学习模型解析装置的结构示意图；

图30为一个实施例中通用机器学习模型执行装置的结构示意图；

图31为一个实施例中计算机设备的内部结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请公开一种用于机器学习模型的生成、执行以及使用方法、装置和存储介质，以实现在机器学习运算过程中，根据运算需要直接在通用机器学习模型文件中读取对应的通用模型，避免重复编译，从而大大提高机器学习算法实现的效率，缩短了从编译到得到执行结果的时间。

本申请提供的通用机器学习模型的生成方法，可以应用于如图1所示的应用环境中。其中，图1所示的应用环境为机器学习开发平台，包括框架层1101、编译层1102、汇聚层1103、驱动层1104以及硬件层1105。

在其中一个实施例中，框架层1101用于提供机器学习任务的算法设计条件，为方便用户搭建自己的神经网络结构，提供便捷的训练和预测工具。可以理解的，框架层101用于实现以下步骤：

接收用户设计的机器学习算法(例如，神经网络结构)；

解析出每个子任务的参数，传递给编译层生成机器指令及相关必要元素；

传递给运行时层执行计算，最终完成用户所需的机器学习任务。

在其中一个实施例中，编译层1102用于在机器学习任务中生成机器指令。具体的，编译层包括编译器、针对高频算子做特殊优化的高性能编程库以及其他能够生成机器指令的模块、装置以及数据库。可以理解的，编译层1102用于接收上层框架层1101传入的机器学习任务的参数，编译生成硬件的二进制机器指令，传递给下层的运行时层保存下来或执行计算。

在其中一个实施例中，汇聚层1103是对驱动程序做进一步封装的程序，可以屏蔽底层不同硬件和驱动的差异，向上层编译层1102或用户提供统一的程序接口。具体的，汇聚层1103封装上层软件不需考虑硬件和驱动程序的细节。进一步的，汇聚层1103用于提供机器学习任务基本操作的程序接口，保存和加载机器学习模型及其在硬件上执行所需的机器指令等必要元素，使上层软件和用户只需要关注机器学习任务本身，而不必考虑具体硬件的差异。可选地，汇聚层提供机器学习任务基本操作的程序接口包括内存空间分配、数据拷贝、启动计算以及其他机器学习任务基本操作的程序接口。

在其中一个实施例中，驱动层1104用于打包封装硬件层1105设备的基本操作，向上层汇聚层1103提供可被调用的程序接口。具体地，驱动层1104的基本操作包括控制数据流的输入输出，向硬件发送控制信号，接收与处理硬件产生的异常信号，多任务的管理和调度等。

在其中一个实施例中，硬件层1105包括机器学习开发平台中的所有硬件设施。可选的硬件层1105包括主处理器、协处理器、存储器，输入输出设备，供电模块以及它们的连接设备。可以理解的，硬件层1105不限于上述器件。

在一个实施例中，请一并参阅图2、图3，提供了一种通用机器学习模型的生成方法及装置。在其中一个实施例中，步骤S1201，获取机器学习任务的任务参数。在其中一个实施例中，通过对外接口模块131000获取机器学习任务的任务参数。具体地，任务参数是生成通用机器学习模型所需要的参数，该参数包括除去输入数据、输出数据之外的参数。具体地，任务参数来自外部程序的输入，或者来自于用户的输入。可以理解的，当任务参数来自于用户的输入时，用户的输入数据需要经过格式转化才能得到任务参数。在其中一个实施例中，步骤S1202，对所述任务参数进行分类处理，得到任务指令及模型参数。在其中一个实施例中，通过模型参数生成模块132100得到模型参数，通过任务指令生成模块132200得到任务指令。具体的，任务指令是指经过编译处理的任务参数。模型参数是指机器学习算法运行过程中所需要对任务参数进行其他处理的处理结果。

在其中一个实施例中，步骤S1203，根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据。在其中一个实施例中，通过栈数据汇集器133100汇集不可共享的数据，通过堆数据汇集器133200汇集共享的数据。可以理解的，不可共享的数据是指在多核平台中，核间不共享的数据；共享的数据是指在多核平台中，核间共享的数据。具体地，汇集是指对任务指令及模型参数进行打包整理。

在其中一个实施例中，步骤S1204，将所述栈数据和堆数据进行整合，得到通用机器学习模型。具体的，通用机器学习模型具有良好的通用性。

具体的，通用机器学习模型既兼容上层的不同框架，例如兼容上层的框架层1101、编译层1102以及汇聚层1103；又能兼容下层的不同驱动层和硬件。进一步的，当一个通用机器学习模型形成之后，能够根据不同的运算核数量、输入数据的地址、输出数据的地址以及其他通用机器学习模型调整数据块，以适应不同的情况。

具体地，通用机器学习模型的生成步骤不限于上述步骤，不限于上述步骤的执行顺序，任何基于本发明构思所做出的变形都视为本发明的保护范围。

在一个实施例中，请一并参阅图3，具体的，所述任务参数包括算法控制参数和计算参数；

对所述算法控制参数进行编译，得到任务指令；在其中一个实施例中，通过任务指令生成模块132200对算法控制参数进行编译。

具体地，算法控制参数包括算法的运算结构。具体地，编译指的是将高级语言转换为机器语言的过程。可以理解的，编译过程是产生目标程序的过程。具体的，任务指令包括直接被计算机识别和执行的指令。可以理解的，任务指令采用二进制编码格式。在一个实施例中，所述根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据的步骤包括：对所述任务指令进行分类处理，得到任务指令堆数据。在一个实施例中，任务指令堆数据是指任务指令生成模块生成的在多核平台中，进行核间共享的任务指令数据。

对所述计算参数进行分类处理，得到模型参数。在其中一个实施例中，通过模型参数生成模块对计算参数进行分类处理，得到模型参数。

具体地，计算参数包括机器学习运算过程中的除去输入数据、输出数据之外的数据。可选的，分类处理包括机器学习中所需对输入数据、输出数据进行的处理，例如预处理操作或后处理操作。可选的，分类处理还包括在机器学习中，对输入数据执行机器学习运算时，所需要获取的数据或参数。例如硬件平台信息等。可以理解的，所述分类处理操作，不限于预处理操作或后处理操作，也不限于获取硬件平台信息，其他对输入数据、输出数据进行非机器学习运算的操作皆属于分类处理操作。通过分类处理操作，兼容了不同输入数据对在不同硬件平台上进行不同运算时所需的各种操作。可以理解的，分类处理操作可以在实践过程中进行修正和补充，以满足通用机器学习模型在不同场景下的应用。

在一个实施例中，请一并参阅图3，在其中一个实施例中，通过模型参数生成模块132100对计算参数进行分类处理，得到模型参数。在一个实施例中，所述根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据的步骤包括：根据所述数据类型对模型参数进行分类处理，得到模型参数栈数据及模型参数堆数据；作为一种可选的实施方式，通过模型参数生成模块132100对计算参数进行分类处理，得到模型参数栈数据和模型参数堆数据。具体的，模型参数栈数据是指在多核平台中不可进行核间共享的模型参数，模型参数堆数据是指在多核平台中可以进行核间共享的模型参数。具体的，通过模型参数栈数据生成模块获得模型参数栈数据，通过模型参数堆数据生成模块获取模型参数堆数据。

对计算参数进行分类处理，得到模型参数的步骤包括对计算参数进行预处理，得到预处理模型数据。在其中一个实施例中，通过预处理模块132121对计算参数进行预处理。在其中一个实施例中，对计算参数进行的预处理操作包括对计算参数进行格式转换操作、拆分操作和分类操作。可选的，预处理操作不限于格式转换操作、拆分操作和分类操作，对计算参数进行的其他操作皆为预处理操作。

在其中一个实施例中，对计算参数进行分类处理，得到模型参数的步骤包括根据所述计算参数获取硬件参数。作为一种可选的实施方式，硬件参数生成模块132122用于生成硬件参数。在其中一个实施例中，硬件参数包括硬件设备固定的指标参数，例如GPU的型号、cuda核数、私有cache大小、共享cache大小、访存带宽等。

在其中一个实施例中，对计算参数进行分类处理，得到模型参数的步骤包括提取所述计算参数中的数据属性参数。作为一种可选的实施方式，属性参数提取模块132123用于提取所述计算参数中的数据的属性参数。在其中一个实施例中，根据所述计算参数获取硬件参数的步骤包括：获取硬件平台信息以及硬件配置参数并存储为堆数据。在其中一个实施例中，属性参数包括数据所特有的一些性质，例如当输入数据为图片时，属性参数就包括图片尺寸、通道数、占用的存储空间、保存格式、每个像素的数据类型等。

在一个实施例中，通过属性提取模块132123提取所述计算参数中的数据属性参数的步骤包括：

获取计算参数的输入数据属性、输出数据属性及中间结果临时空间属性；在所述输入数据的属性中提取所述输入数据的数据量，并分配所述输入数据存储空间；在所述输出数据的属性中提取所述输出数据的数据量，并分配所述输出数据存储空间；在所述中间结果临时空间属性中提取中间结果临时空间的数据量，并分配所述中间结果临时存储空间；将所述输入数据存储空间及输出数据存储空间存储为堆数据，将所述中间结果临时空间存储为栈数据。

在一个实施例中，根据所述数据类型对模型参数进行分类处理，得到模型参数栈数据的步骤包括：根据共享属性对所述模型参数进行分类，得到可共享模型参数及不可共享模型参数；对所述不可共享模型参数进行汇集，得到模型参数栈数据。在其中一个实施例中通过模型参数栈数据生成模块132110生成模型参数栈数据。在一个实施例中，所述根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据的步骤包括：对所述模型参数栈数据进行汇集，得到所述栈数据。在其中一个实施例中，通过栈数据汇集器133100汇集栈数据。通过汇集栈数据，能够对不可共享的数据进行统一处理，使得机器学习模型中的栈数据模式化，从而使得产生的机器学习模型具有通用性。

在一个实施例中，所述根据所述栈数据布局信息对所述模型参数栈数据进行打包整合，得到所述栈数据块的步骤还包括：根据所述栈数据布局信息对所述不可共享模型参数、所述中间结果临时空间数据进行整合，得到所述栈数据块。

在一个实施例中，根据所述数据类型对模型参数进行分类处理，得到模型参数堆数据的步骤包括：根据共享属性对所述模型参数进行分类，得到可共享模型参数及不可共享模型参数；对可共享模型参数进行汇集，得到模型参数堆数据。在其中一个实施例中，通过模型参数堆数据生成模块132120执行上述步骤，得到模型参数堆数据。通过汇集堆数据，能够对共享的数据进行统一处理，使得机器学习模型中的栈数据模式化，从而使得产生的机器学习模型具有通用性。

在一个实施例中，模型参数堆数据包括模型参数静态数据和模型参数动态数据。具体的，模型参数静态数据是在机器学习算法运行过程中不发生变化的数据，例如任务指令，模型参数堆数据、硬件平台信息。模型参数动态数据是指在机器学习算法运行过程中会发生变化的数据，例如输入数据、输出数据。

在一个实施例中，所述将所述栈数据和堆数据进行整合，得到通用机器学习模型的步骤包括：通过静态数据汇集器133210将所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到连续的静态数据块。在其中一个实施例中，根据所述静态数据布局信息，对所述任务指令堆数据、模型参数堆数据、硬件平台信息以及硬件配置参数进行整合，得到所述连续的静态数据块。

通过汇集静态数据块，能够对静态数据块数据进行统一处理，使得机器学习模型中的静态数据模式化，从而使得产生的机器学习模型具有通用性。

在一个实施例中，所述将所述栈数据和堆数据进行整合，得到通用机器学习模型的步骤包括：通过动态数据汇集器133220对所述模型参数动态数据进行打包整合，得到连续的动态数据块。在其中一个实施例中，根据所述动态数据布局信息对所述输入数据存储空间以及所述输出数据存储空间进行整合，得到所述连续的动态数据块。通过汇集动态数据块，能够对动态数据块数据进行统一处理，使得机器学习模型中的动态数据模式化，从而使得产生的机器学习模型具有通用性。

在一个实施例中，对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型。作为一种可选的实施方式，通用机器学习模型保存在离线文件中。具体的，离线文件中包括一种至多种通用机器学习模型。具体的，根据预先设定的规则，对离线文件中的通用机器学习模型进行调用。具体的，离线文件按照既定的规则存储在硬盘中。作为一种可选的实施方式，离线文件包括在线函数。具体的，在线函数存储在内存中。

在一个实施例中，所述对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型的步骤包括：根据所述任务指令获取静态数据布局信息、动态数据布局信息以及栈数据布局信息；根据所述静态数据布局信息对所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到所述连续的静态数据块；根据所述动态数据布局信息对对所述模型参数动态数据进行打包整合，得到连续的动态数据块；根据所述栈数据布局信息对所述模型参数栈数据进行打包整合，得到所述栈数据块；对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行整合。

在其中一个实施例中，对算法控制参数进行编译，得到各数据块布局信息。具体的，数据块布局信息用于数据块汇集整合，各数据块根据各数据块布局信息进行存放，以优化内存分配。作为一种可选的实施方式，数据块布局信息是对各数据块优先整块存储。作为一种可选的实施方式，当存储空间无法满足数据块整块存储时，根据处理器核的处理顺序对内存分配进行优化，使得读取数据块信息便捷。

在一个实施例中，通用机器学习模型生成方法进一步还包括生成硬件专用参数集。具体的，硬件专用参数集是指通过预先准备相关参数，弥补硬件不足，满足不同机器学习算法的运算需求。

在一个实施例中，请一并参阅图3，一种通用机器学习模型的生成装置，所述装置包括：对外接口模块131000，用于获取机器学习任务的任务参数；分类处理模块132000，用于对所述任务参数进行分类处理，得到任务指令及模型参数；参数汇集模块133000，用于根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据；模型生成模块134000，用于将所述栈数据和堆数据进行整合，得到通用机器学习模型。

上述通用机器学习模型的生成装置，通过对任务参数进行分类处理，很好的兼容了各类机器学习算法的运算过程，并通过汇集及整合过程得到相应机器学习算法的通用模型。通过上述机器学习算法的通用模型，使得在算法运行中直接执行相应通用模型的编译结果，避免重复编译，从而大大提高机器学习算法实现的效率，缩短了从编译到得到执行结果的时间。

在一个实施例中，所述任务参数包括算法控制参数和计算参数；所述分类处理模块132000包括：任务指令生成模块132200，用于对所述算法控制参数进行编译，得到任务指令；模型参数生成模块132110，对所述计算参数进行分类处理，得到模型参数。

在一个实施例中，所述模型参数生成模块132100包括：模型参数栈数据生成模块32110，用于对可共享模型参数进行汇集，得到模型参数栈数据；模型参数堆数据生成模块132120，用于对所述不可共享模型参数进行汇集，得到模型参数堆数据。

在一个实施例中，所述模型参数生成模块还包括：预处理模块132121，用于对所述计算参数进行预处理，得到预处理模型数据；硬件参数生成模块132122，用于根据所述计算参数获取硬件参数；属性提取模块132123，用于提取所述计算参数中的数据属性参数。

在一个实施例中，所述任务指令包括任务指令堆数据；所述参数汇集模块133000包括：栈数据汇集器133100，用于对所述模型参数栈数据进行打包整合，得到栈数据块；模型参数动态数据汇集器133220，用于对所述模型参数动态数据进行打包整合，得到连续的动态数据块；模型参数静态数据汇集器133210，用于将所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到连续的静态数据块。

在一个实施例中，所述模型生成模块134000用于对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型。

关于通用机器学习模型生成装置的具体限定可以参见上文中对于通用机器学习模型生成方法的限定，在此不再赘述。上述通用机器学习模型装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，请一并参阅图4，提供了一种通用机器学习模型的执行方法。在一个实施例中，通用机器学习模型的执行方法包括：

步骤S1410，获取通用机器学习模型；

具体地，通用机器学习模型是按照上述通用机器学习模型的方法生成的通用机器学习模型。关于通用机器学习模型生成方法的具体说明参见上文，在此不再赘述。

步骤S1420，对所述通用机器学习模型进行分类拆解，得到栈区数据和堆区数据；

具体的，分类拆解的依据是根据数据类型的不同进行拆解。具体地，栈数据是指在多核开发平台中不可核间共享的数据，堆数据是指在多核开发平台中能够进行核间共享的数据。在一个实施例中，步骤S1420所述对所述通用机器学习模型进行分类拆解，得到栈数据和堆数据的步骤包括：步骤S14210，将所述通用机器学习模型中可共享的数据拆解为栈数据；步骤S14220，将所述通用机器学习模型中不可共享的数据拆解为堆数据。

在其中一个实施例中，所述方法还包括将所述栈数据分配到栈区；

具体的，栈区是指内存中主要存储栈数据的存储空间。可选的，栈区中存储的数据还包括机器学习运算过程中所产生的中间结果。

在其中一个实施例中，所述方法还包括将所述堆数据分配到堆区；

具体的，堆区是指内存中主要存储堆数据的存储空间。可选的，堆区中存储的数据还包括机器学习运算过程中所产生的中间结果。具体的，堆区数据包括存储在堆区的数据，例如堆数据以及各堆数据块布局信息。

步骤S1430，根据栈区数据、堆区数据以及输入数据进行计算，得到输出数据。具体的，步骤S1430的计算过程由硬件计算单元执行，在步骤S1403的步骤执行完毕后，神经网络处理器控制硬件计算单元关闭。具体的，硬件计算单元由算术逻辑单元、累加器、状态寄存器、通用寄存器组等组成。算术逻辑运算单元的基本功能为加、减、乘、除四则运算，与、或、非、异或等逻辑操作，以及移位、求补等操作。可以理解的，硬件计算单元通过取用栈区数据和堆区数据能够直接执行运算，不必等待机器学习算法编译完成。因此，通过通用机器学习模型能够提高机器学习算法的运算效率。

在一个实施例中，所述栈数据包括模型参数栈数据；

在其中一个实施例中，步骤S14230，将栈数据分配到栈区步骤还包括：

步骤S14231，获取所述模型参数栈数据所需占用空间的大小以及中间结果临时存储空间的大小。具体的，根据模型参数栈数据所需占用空间的大小以及中间结果临时存储空间的大小，为模型参数栈数据以及中间结果临时存储空间分配存储地址及存储空间。

步骤S14232，计算所述模型参数栈数据所需占用存储空间的大小与所述中间结果临时存储空间的大小之和，得到第一存储空间的大小。可以理解的，模型参数栈数据在机器学习运行过程中会产生中间结果，因此模型参数栈数据所需占用的存储空间与中间结果临时存储空间之和是内存分配给模型参数栈区的最小存储空间。

在一个实施例中，步骤S14233，分配所述模型参数栈区的存储空间，所述模型参数栈区的存储空间大于或等于所述第一存储空间的大小。具体的，模型参数栈区是指主要用于存储模型参数栈数据的存储区。

在一个实施例中，将运行阶段变化的堆数据存储为模型参数动态堆数据，将运行阶段不变的堆数据存储为模型参数静态堆数据。关于模型参数栈数据和模型参数堆数据的具体说明参见上述关于通用模型生成方法中的相关内容，在此不再赘述。

在一个实施例中，步骤S14240，所述将所述堆数据分配到堆区的步骤还包括：步骤S14241，获取模型参数动态数据所需占用存储空间的大小；步骤S14242，将所述模型参数动态数据分配到模型参数动态堆区；步骤S14243，将所述模型参数静态数据分配到模型参数静态堆区。

在其中一个实施例中，步骤S14242，所述将所述模型参数动态数据分配到动态数据堆区的步骤还包括：

步骤S142421，将所述模型参数动态数据的存储空间与所述输入数据的存储空间与所述输出数据的存储空间相加，得到第二存储空间的大小；

步骤S142422，分配模型参数动态堆区的存储空间，所述模型参数动态堆区的存储空间大于或等于所述第二存储空间的大小。具体的，分配模型参数动态堆区的存储空间大于或等于所述第二存储空间的大小。通过步骤S142422的步骤，使得存储空间在保证正常运行的情况下获取更多的扩展性。

在一个实施例中，步骤S14240，所述将所述堆数据分配到堆区，得到堆区数据的步骤还包括：

将所述模型参数动态堆区、所述模型参数静态堆区分配到一段连续的存储空间，得到一个具有连续存储空间的堆区。在其中一个实施例中，所述堆区中的数据包括所述模型参数动态数据、所述模型参数静态数据以及所述输入数据、所述输出数据。

在一个实施例中，模型参数静态数据包括任务指令堆数据。具体的，任务指令堆数据是指能够进行核间共享的任务指令数据。

在一个实施例中，所述模型参数静态堆区的存储空间大于或等于所述模型参数静态堆数据的存储空间。具体的，模型参数静态堆区的存储空间大于或等于模型参数静态数据所需占用的存储空间大小。通过本实施例使得模型参数静态堆区在保证正常运行的情况下获取更多的扩展性。

在一个实施例中，所述根据所述栈区数据和所述堆区数据以及输入数据进行计算，得到输出数据的步骤还包括：待所述对所述输入数据计算完成，关闭硬件计算单元。具体的，关闭硬件计算单元有利于降低在机器学习运算过程中对计算机资源的占用。

在一个实施例中，所述根据所述栈区数据和所述堆区数据，对所述输入数据进行计算，得到输出数据的步骤还包括：在所述堆区提取所述输出数据；将所述输出数据传输至开发平台外部。在一个实施例中，将输入数据、输出数据存储于堆区。可以理解的，将输入数据、输出数据存储于模型参数动态堆区。

在一个实施例中，请一并参阅图5，提供了一种通用机器学习模型的执行装置，所述装置包括：

模型获取模块15100，用于获取通用机器学习模型；

模型拆解模块15200，用于对所述通用机器学习模型进行分类拆解，得到栈数据和堆数据；

结果输出模块15400，获取栈区数据、堆区数据以及输入数据进行计算，得到输出数据。

在其中一个实施例中，所述栈区数据包括栈数据，所述堆区数据包括堆数据；所述模型拆解模块15200包括：

栈区数据分配模块15310，用于将所述通用机器学习模型中可共享的数据拆解为栈数据。可选的，栈区数据分配模块15310还用于将所述栈数据分配到栈区；

堆区数据分配模块15320，用于将所述堆数据分配到堆区。可选的，堆区数据分配模块15320还用于将所述通用机器学习模型中不可共享的数据拆解为堆数据。

在其中一个实施例中，所述栈数据模型参数栈数据。在其中一个实施例中，所述模型参数栈数据分配模块包括：第一存储空间计算模块，用于计算所述模型参数栈数据所需占用存储空间的大小与中间结果临时存储空间的大小之和，得到第一存储空间的大小；模型参数栈数据分配模块，分配所述模型参数栈区的存储空间，所述模型参数栈区的存储空间大于或等于所述第二存储空间的大小。

栈区数据分配模块15310，用于将所述通用机器学习模型中不可共享的数据拆解为栈数据；堆区数据分配模块15320，用于将所述通用机器学习模型中可共享的数据拆解为堆数据。在其中一个实施例中，所述栈区数据分配模块15310还用于将所述栈数据分配到栈区。在其中一个实施例中，所述堆区数据分配模块15320还用于将所述堆数据分配到堆区。

在其中一个实施例中，所述结果输出模块15400还包括：

数据提取模块15410，用于从所述堆区提取所述输出数据；

数据输出模块15420，用于输出所述输出数据。关于通用机器学习模型执行装置的具体限定可以参见上文中对于通用机器学习模型执行方法的限定，在此不再赘述。上述通用机器学习模型执行装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，请一并参阅图3、图6，其中图6提供了一个通过两层神经网络对jpg格式的图片进行特征提取的示意图。在一个实施例中，通过两层神经网络对图片进行提取的方法包括：

步骤S16100，对输入图片进行输入预处理操作，得到处理后的输入图片；

在一个实施例中，属性提取模块132123提取输入图片属性信息，例如输入图片的尺寸、数据格式、压缩格式信息，并将提取的属性信息传送至预处理层。具体的，输入预处理层6100根据输入图片的属性信息，将jpg压缩图片还原成未经压缩的原始图像，并为逐个数据点赋值，以便于卷积层16200对图像的处理。

步骤S16200，对所述处理后的输入图片进行卷积运算，得到卷积运算结果。

在一个实施例中，卷积层16200对图像信息进行特征提取。通用机器学习模型已经根据图6所示的机器学习算法运行平台的硬件信息生成了相对应的任务指令。当机器学习算法运行平台的相应硬件启动后，任务指令控制硬件逐步获取输入数据和权值数据做卷积运算，直到计算完成，得到中间结果。具体的，权值数据是在通用机器学习模型中已经训练完成的数据。在一个实施例中，中间结果临时空间的属性包括中间结果的属性，例如特征图的尺寸、占用的存储空间大小。具体的，根据中间结果临时空间的属性为中间结果申请合适的存储空间。

步骤S16300，对卷积运算结果进行激活，得到激活结果。

在一个实施例中，激活层16300选用sigmoid激活函数，对卷积结果做0-1之间的映射。具体的，通用机器学习模型已经根据图6所示的机器学习算法运行平台的硬件信息生成了相对应的任务指令。当机器学习算法运行平台的硬件启动后，任务指令控制相应硬件逐步获取输入数据和权值数据做激活运算。在其中一个实施例中，在执行本实施例中图片识别的机器学习算法运行平台缺少除法器，但sigmoid函数包含除法运算，则在硬件专用参数集中取用相应参数。在一个实施例中，硬件参数集中提前准备好需要除数的倒数。

在一个实施例中，在激活层16300进行激活运算时，由任务指令控制硬件获取进行激活运算的数据，以及在硬件专用参数集中获取参数数据。在一个实施例中，任务指令控制硬件进行卷积运算，直至卷积运算完成，得到输出数据。

步骤S16400，对激活结果进行输出预处理，得到最终图片。

在一个实施例中，输出预处理层16400根据图像预设的保存格式，对输出数据进行输出预处理操作。在一个实施例中，输出图片预设以jpg格式进行保存，则输出预处理层16400根据输出图片的预设格式对输出图片的尺寸、压缩格式、数据格式等进行处理，得到最终图片。

可以理解的是，虽然图2、图4以及图6的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2、图4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储通用机器学习模型数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种通用机器学习模型的生成方法和/或通用机器学习模型执行方法。

本申请提供的通用机器学习模型文件生成方法，可以应用于如图1所示的应用环境中。本申请提供的通用机器学习模型的生成方法，可以应用于如图8所示的应用环境中。其中，图8所示的应用环境为机器学习开发平台，包括框架层2101、编译层2102、汇聚层2103、驱动层2104以及硬件层2105。

在其中一个实施例中，框架层2101用于提供机器学习任务的算法设计条件，为方便用户搭建自己的神经网络结构，提供便捷的训练和预测工具。可以理解的，框架层2101用于实现以下步骤：接收用户设计的机器学习算法(例如，神经网络结构)；解析出每个子任务的参数，传递给编译层生成机器指令及相关必要元素；传递给运行时层执行计算，最终完成用户所需的机器学习任务。

在其中一个实施例中，编译层2102用于在机器学习任务中生成机器指令。具体的，编译层包括编译器、针对高频算子做特殊优化的高性能编程库以及其他能够生成机器指令的模块、装置以及数据库。可以理解的，编译层2102用于接收上层框架层2101传入的机器学习任务的参数，编译生成硬件的二进制机器指令，传递给下层的运行时层保存下来或执行计算。

在其中一个实施例中，汇聚层2103是对驱动程序做进一步封装的程序，可以屏蔽底层不同硬件和驱动的差异，向上层编译层2102或用户提供统一的程序接口。具体的，汇聚层103封装上层软件不需考虑硬件和驱动程序的细节。进一步的，汇聚层2103用于提供机器学习任务基本操作的程序接口，保存和加载机器学习模型及其在硬件上执行所需的机器指令等必要元素，使上层软件和用户只需要关注机器学习任务本身，而不必考虑具体硬件的差异。可选地，汇聚层提供机器学习任务基本操作的程序接口包括内存空间分配、数据拷贝、启动计算以及其他机器学习任务基本操作的程序接口。

在其中一个实施例中，驱动层2104用于打包封装硬件层2105设备的基本操作，向上层汇聚层103提供可被调用的程序接口。具体地，驱动层2104的基本操作包括控制数据流的输入输出，向硬件发送控制信号，接收与处理硬件产生的异常信号，多任务的管理和调度等。

在其中一个实施例中，硬件层2105包括机器学习开发平台中的所有硬件设施。可选的硬件层2105包括主处理器、协处理器、存储器，输入输出设备，供电模块以及它们的连接设备。可以理解的，硬件层2105不限于上述器件。

在一个实施例中，请一并参阅图9、图10，提供了一种通用机器学习模型的生成方法及装置。在其中一个实施例中，步骤S2201，获取机器学习任务的任务参数。在其中一个实施例中，通过对外接口模块231000获取机器学习任务的任务参数。具体地，任务参数是生成通用机器学习模型所需要的参数，该参数包括除去输入数据、输出数据之外的参数。具体地，任务参数来自外部程序的输入，或者来自于用户的输入。可以理解的，当任务参数来自于用户的输入时，用户的输入数据需要经过格式转化才能生成任务参数。在其中一个实施例中，步骤S2202，对所述任务参数进行分类处理，生成任务指令及模型参数。在其中一个实施例中，通过模型参数生成模块232100生成模型参数，通过任务指令生成模块232200生成任务指令。具体的，任务指令是指经过编译处理的任务参数。模型参数是指机器学习算法运行过程中所需要对任务参数进行其他处理的处理结果。

在其中一个实施例中，步骤S2203，根据数据类型将所述任务指令及模型参数进行汇集，生成栈数据和堆数据。在其中一个实施例中，通过栈数据汇集器233100汇集不可共享的数据，通过堆数据汇集器233200汇集共享的数据。可以理解的，不可共享的数据是指在多核平台中，核间不共享的数据；共享的数据是指在多核平台中，核间共享的数据。具体地，汇集是指对任务指令及模型参数进行打包整理。在其中一个实施例中，步骤S2204，将所述栈数据和堆数据进行整合，生成通用机器学习模型。

在一个实施例中，请一并参阅图11，通用机器学习模型文件生成方法，包括：

步骤S2402，获取通用机器学习模型。可选地，通用机器学习模型可以是前述通过步骤S2201-步骤S2204生成的通用机器学习模型，还可以是其他模型文件。

步骤S2404，计算所述通用机器学习模型的存储偏移量。具体地，通用机器学习模型可以是一个，也可以是多个。在其中一个实施例中，当通用机器学习模型为多个时，计算每个通用机器学习模型的存储偏移量。

步骤S2406，根据所述通用机器学习模型以及所述通用机器学习模型存储偏移量，生成模型目录。其中，模型目录是通用机器学习模型文件中所有模型存放位置的记录，通过模型目录，可以快速索引到目标模型。

步骤S2408，根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件。本实施例中的通用机器学习模型文件中不仅包括通用机器学习模型本身，还包括模型目录，使得在调用通用机器学习模型文件中的通用机器学习模型时，快速定位和读取对应的模型。

上述通用机器学习模型文件生成方法，通过生成关于获取的通用机器模型的目录，并根据通用机器学习模型以及模型目录生成通用机器学习模型文件。实现了在机器学习运算过程中，根据运算需要直接在通用机器学习模型文件中读取对应的通用模型，避免重复编译，从而大大提高机器学习算法实现的效率，缩短了从编译到生成执行结果的时间。

在一个实施例中，请一并参阅图12，步骤S2404计算所述通用机器学习模型的存储偏移量的步骤包括：

步骤S24041，获取每个所述通用机器学习模型占用的存储空间大小和所述通用机器学习模型的数量。在其中一个实施例中，根据每个所述通用机器学习模型占用的存储空间大小和所述通用机器学习模型的数量，生成通用机器学习模型文件所要占用的存储空间大小。

步骤S24042，获取所述通用机器学习模型的存放顺序。具体地，通用机器学习模型的存放顺序可以遵循预设规则，也可以随机生成存放顺序。具体地，通用机器学习模型的存放顺序确定后，通用机器学习模型即按照确定的存放顺序进行存放。

步骤S24043，根据每个所述通用机器学习模型占用的存储空间大小、所述通用机器学习模型的数量、所述通用机器学习模型的存放顺序，计算每个所述通用机器学习模型的存储偏移量。其中，存储偏移量是指每个通用机器学习模型在通用机器学习模型文件中的存储的相对位置。例如模型A、模型B与模型C依次从文件头到文件尾存储，模型A的大小为2比特,模型B的大小为3比特,模型C的大小为1比特，则模型A的偏移量为0，模型B的偏移量为2比特，模型C的偏移量为2+3＝5比特。

在其中一个实施例中，请一并参阅图13，步骤S2408根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件包括：

步骤S2408a，获取所述通用机器学习模型文件的文件头和文件尾；

步骤S2408b，根据所述文件头、所述模型目录、所述通用机器学习模型以及所述文件尾，生成所述通用机器学习模型文件。其中，所述文件头是指位于通用机器学习模型文件开头的一段承担一定任务的数据，所述文件尾是指位于通用机器学习模型尾部的一段承担一定任务的数据。

在另一个实施例中，请一并参阅图14，步骤S2408根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件包括：

步骤S2408c，创建通用机器学习模型文件的标识码。具体地，通用机器学习模型文件的标识码是指通用机器学习模型文件附带的起标识作用的字符，通过文件的标识码可以将不同的通用机器学习模型文件区分开，便于准确获取对应的通用机器学习模型文件。步骤S2408d根据所述标识码、所述通用机器学习模型、所述模型目录，生成通用机器学习模型文件。在其中一个实施例中，通用机器学习模型文件的标识码存放在文件头。

在再一个实施例中，请一并参阅图15，步骤S2408根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件，包括：

步骤S2408e创建所述通用机器学习模型文件的校验码和/或纠错码。其中，校验码由通用机器学习模型文件中的运算得出，用以检验该通用机器学习模型文件的正确性。在其中一个实施例中，校验码位于一个通用机器学习模型文件中的最后一位，其中，纠错码是指文件接收端，能够发现通用机器学习模型文件在传输过程中出现的错误，并进行纠正的一串字符。

通过本实施例的步骤，增加了通用机器学习模型文件接收的安全性和稳定性。当在传输过程中发送传输错误时，能够及时通过校验码发现错误，以及通过纠错码纠正错误，增加了数据的稳定性和容错性，防止因接收错误导致后续流程的相应出错。

步骤S2408f，根据所述通用机器学习模型文件的校验码和/或纠错码、所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件。在其中一个实施例中，校验码和/纠错码存储在通用机器学习模型中的文件尾。

在一个实施例中，请一并参阅图16，步骤S2408根据所述通用机器学习模型以及所述模型目录，生成通用机器学习模型文件还包括：

步骤S24081，计算所述通用机器学习模型文件所需占用的存储空间的大小。

在其中一个实施例中，通用机器学习模型文件包括一个或多个通用机器学习模型。在另一个实施例中，通用机器学习模型文件还包括文件头、文件尾、模型目录。可选地，通用机器学习文件还可以包括模型目录的存储空间大小以及多个通用机器学习模型的存储空间大小的总和。可选地，通用机器学习文件还可以包括文件头的存储空间大小、文件尾的存储空间大小、模型目录的存储空间大小以及多个通用机器学习模型的存储空间大小的总和。

步骤S24082，根据所述通用机器学习模型、所述通用机器学习模型文件所需占用的存储空间的大小以及所述模型目录，生成通用机器学习模型文件。在其中一个实施例中，通用机器学习模型文件模型目录、通用机器学习模型依次由文件头部到文件尾部存放。

在一个实施例中，请一并参阅图17，提供了另一种通用机器学习模型生成方法，包括：步骤S2501，获取通用机器学习模型；步骤S2502，对所述通用机器学习模型进行存储优化处理，生成二级模型；步骤S2503，计算所述二级模型的存储偏移量；步骤S2504，根据所述二级模型以及所述二级模型存储偏移量，生成二级模型目录；步骤S2505，根据所述二级模型以及所述二级模型目录，生成通用机器学习模型文件。

步骤S2501与上述实施例中步骤S2402的执行过程相同，在此不再赘述。另外，步骤S2503与步骤S2404，步骤S2504与步骤S2406、步骤S2505与步骤S2408的区别在于执行对象不同，即步骤S2503、步骤S2504以及步骤S2505的执行对象是二级模型，步骤S2404、步骤S2406以及步骤S2408的执行对象是通用机器学习模型，两个实施例中上述对应步骤执行过程一致，在此不再赘述。

通过步骤S2501-步骤S2505的方法，将原始生成的通用机器学习模型进行优化处理，便于通用机器学习模型文件的存放和传输，增加了传输过程中的安全性和稳定性。

在其中一个实施例中，步骤S2502，对所述通用机器学习模型进行存储优化处理，生成二级模型的步骤包括：对所述通用机器学习模型进行压缩处理，生成二级模型。通过本实施例中将通用机器学习模型进行压缩，便于通用机器学习模型在通用机器学习模型文件中存储，进而便于在执行对应通用机器学习模型时快速获取对应的通用机器学习模型。

在另一个实施例中，步骤S2502，对所述通用机器学习模型进行存储优化处理，生成二级模型的步骤还包括：对所述通用机器学习模型进加密处理，生成二级模型。通过本实施例中将通用机器学习模型进行加密，能够增加通用机器学习模型在存储和传输过程中的安全性。

获取所述机器学习二级模型文件的文件头和文件尾；

获取所述二级模型的存放顺序；

创建机器学习二级模型文件的标识码；

一种通用机器学习模型文件生成方法，所述方法包括：

获取机器学习任务的任务参数；

对所述任务参数进行分类，生成任务指令及模型参数；

将所述栈数据和堆数据进行整合，生成通用机器学习模型；

在又一个实施例中，请一并参阅图18，提供了又一种通用机器学习模型生成方法，包括：

步骤S2601，获取机器学习任务的任务参数。具体地，任务参数是生成通用机器学习模型所需要的参数，该参数包括除去输入数据、输出数据之外的参数。具体地，任务参数来自外部程序的输入，或者来自于用户的输入。可以理解的，当任务参数来自于用户的输入时，用户的输入数据需要经过格式转化才能生成任务参数。

步骤S2602，对所述任务参数进行分类处理，生成任务指令及模型参数。具体的，任务指令是指经过编译处理的任务参数。模型参数是指机器学习算法运行过程中所需要对任务参数进行其他处理的处理结果。

步骤S2603,根据数据类型将所述任务指令及模型参数进行汇集，生成栈数据和堆数据。可以理解的，不可共享的数据是指在多核平台中，核间不共享的数据；共享的数据是指在多核平台中，核间共享的数据。具体地，汇集是指对任务指令及模型参数进行打包整理。

步骤S2604，将所述栈数据和堆数据进行整合，生成通用机器学习模型。具体的，通用机器学习模型具有良好的通用性。在其中一个实施例中，通用机器学习模型既兼容上层的不同框架，例如兼容上层的框架层2101、编译层2102以及汇聚层2103；又能兼容下层的不同驱动层和硬件。进一步的，当一个通用机器学习模型形成之后，能够根据不同的运算核数量、输入数据的地址、输出数据的地址以及其他通用机器学习模型调整数据块，以适应不同的情况。

步骤S2605，计算所述通用机器学习模型的存储偏移量；步骤S2606，根据所述通用机器学习模型以及所述通用机器学习模型存储偏移量，生成模型目录；步骤S2607，根据所述通用机器学习模型、所述模型目录，生成通用机器学习模型文件。本实施例中的步骤 S2605、步骤S2606、步骤S2607与上述实施例中的步骤S2405、步骤S2406、步骤S2408的执行过程相同，在此不再赘述。

在一个实施例中，请一并参阅图13，提供了一种通用机器学习模型文件生成装置，包括：模型填充器2701、目录生成器2702以及文件生成器2703；所述模型填充器2701和所述目录生成器2702相连，所述文件生成器2703分别与所述模型填充器2701、所述目录生成器2702相连。具体地，所述模型填充器2701用于获取所述通用机器学习模型；

所述目录生成器2702用于计算所述通用机器学习模型的存储偏移量；以及

所述文件生成器2703用于根据所述通用机器学习模型、所述模型目录，生成通用机器学习模型文件。

在一个实施例中，所述模型填充器2701还用于将所述通用机器学习模型，按序存入所述文件生成器。

在一个实施例中，所述文件生成器2703还包括文件头生成器27031和所述文件尾生成器27032；所述文件头生成器27031与所述目录生成器2702相连，所述文件尾生成器27032与所述模型填充器2701相连。在其中一个实施例中，所述文件头生成器27031还用于创建通用机器学习模型文件的标识码，以及根据所述标识码、所述通用机器学习模型、所述模型目录，生成通用机器学习模型文件。

在一个实施例中，所述文件尾生成器27032还用于创建所述通用机器学习模型文件的校验码和/或纠错码。

在一个实施例中，所述生成装置还包括模型存储优化器2704，所述模型存储优化器2704与所述模型填充器2701相连和所述目录生成器相连，用于对所述通用机器学习模型进行存储优化处理，生成二级模型。在其中一个实施例中，二级模型填充器用于接收所述二级模型，并将所述二级模型按序存入所述文件生成器。

在一个实施例中，所述生成装置还包括文件大小计算器2705，所述文件大小计算器2705与所述目录生成器2702连接，用于计算所述通用机器学习模型占用的存储空间大小，以及计算所述通用机器学习模型文件所需占用的存储空间的大小。

在其中一个实施例中，所述文件大小计算器2705与模型存储优化器2704相连。具体的，上述实施例中的连接关系包括电连接或无线连接。

在一个实施例中，一种通用机器学习模型文件生成装置，请一并参阅图20，所述生成装置包括：

对外接口模块2801，用于获取机器学习任务的任务参数；

分类处理模块2802，用于对所述任务参数进行分类处理，生成任务指令及模型参数；

参数汇集模块2803，用于根据数据类型将所述任务指令及模型参数进行汇集，生成栈数据和堆数据；

模型生成模块2804，用于将所述栈数据和堆数据进行整合，生成通用机器学习模型；

存储偏移量计算模块2805，用于计算所述通用机器学习模型的存储偏移量；

模型目录生成模块2806，用于根据所述通用机器学习模型以及所述通用机器学习模型存储偏移量，生成模型目录；

模型文件生成模块2807，用于根据所述通用机器学习模型、所述模型目录，生成通用机器学习模型文件。

在其中一个实施例中，请一并参阅图20，通用机器学习模型生成装置与通用机器学习模型文件生成装置相连，所述通用机器学习模型文件生成装置用于将通用机器学习模型生成装置中生成的通用机器学习模型转化为通用机器学习模型文件。

关于通用机器学习模型文件生成装置的具体限定可以参见上文中对于通用机器学习模型文件生成方法的限定，在此不再赘述。上述通用机器学习模型文件生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，请一并参阅图21，提供了一种通用机器学习模型文件解析方法，包括：

步骤S2701，获取通用机器学习模型文件。其中，通用机器学习模型文件包括通过步骤S2402步骤S2408生成的模型文件。进一步地，通用机器学习文件中的通用机器学习模型包括通过步骤S2201-步骤S2204生成的通用机器学习模型。

步骤S2702，在所述通用机器学习模型文件中读取模型目录。具体地，模型目录包括通过上述步骤S2406生成的模型目录。

步骤S2703，根据所述模型目录，读取目标通用机器学习模型。其中，所述目标通用机器学习模型是指在通用机器学习模型文件中所要取出的通用机器学习模型。目标通用机器学习模型可以根据用户操作指令确定，还可以根据任务执行需要确定。

在一个实施例中，请一并参阅图15，步骤S2701，获取通用机器学习模型文件包括：

步骤S27011，获取所述通用机器学习模型文件的标识码。具体地，通用机器学习模型文件的标识码可以位于通用机器学习模型文件头，以方便对通用机器学习模型文件进行识别。具体地，通用机器学习模型文件的标识码是指通用机器学习模型文件附带的起标识作用的字符，通过识别文件的标识码可以将不同的通用机器学习模型文件区分开，便于准确获取对应的通用机器学习模型文件。进一步地，标识码可以是通过上述步骤S408c创建的通用机器学习模型文件的标识码。

步骤S27012，检测所述标识码是否符合预设规则。在其中一个实施例中，预设规则是指在读取对应的通用机器学习模型文件之前，获取的通用机器学习模型文件的标识码的描述信息。进一步地，在获取到通用机器学习模型文件之后，检测通用机器学习模型文件的标识码与描述信息是否相匹配，若匹配，则判断标识码符合预设规则，若不匹配则判断标识码符合预设规则。

步骤S27013，若所述标识码符合预设规则，则在所述通用机器学习模型文件中读取模型目录。具体地，若所述标识码符合预设规则，则可以判断所述通用机器学习模型文件在传输过程中没有发生异常。

在另一个实施例中，若标识码不符合预设规则，则获取的通用机器学习模型文件与要读取的通用机器学习模型文件不一致。具体地，若标识码不符合预设规则，则判断读取的通用机器学习模型文件发生异常，则所述通用机器学习模型文件解析方法停止执行。

在一个实施例中，请一并参阅图23，步骤S2701，获取通用机器学习模型文件包括：

步骤S27014，获取所述通用机器学习模型文件的校验码。具体地，若标识码合法，则获取到的通用机器学习模型文件无误，进一步检测获取到的通用机器学习模型文件的校验码，以判断通用机器学习模型文件的内容是否无误。

步骤S27015，校验所述校验码与预设标准码是否一致，若所述校验码与预设标准码不一致，则执行纠错运算。其中，预设标准码与通用机器学习模型文件内容无误时的校验码一致。进一步地，若所得的校验码与预设标准码一致，则可以判断通用机器学习模型文件的内容无误，反之，若所得的校验码与预设标准码不一致，则可以判断通用机器学习模型文件内容有误。可选地，若通用机器学习模型文件有误，产生错误的原因可以是原始文件有误，还可以是原始文件无误但是在传输过程中发生错误。

在一个实施例中，请一并参阅图24，步骤S27015校验所述校验码与预设标准码是否一致，若所述校验码与预设标准码不一致，则执行纠错运算包括：

步骤S27015a，获取纠错码。其中，纠错码可以是通过上述步骤S2408e得到的纠错码。具体地，错码是指文件接收端，能够发现通用机器学习模型文件在传输过程中出现的错误，并进行纠正的一串字符。

步骤S27015b，根据所述纠错码对所述通用机器学习模型文件进行纠错，得到纠错后的模型文件。具体地，当文件校验码与预设标准码不一致时，判断通用机器学习模型文件内容出错后根据文件纠错码对通用机器学习模型进行纠错。具体地，纠错码可以位于通用机器学习模型文件的文件尾。

步骤S27015c,校验所述纠错后的模型文件的校验码与所述预设标准码是否一致。具体地，在纠错完成后，再次校验纠错后的模型文件的校验码是否与预设标准码一致，以检测纠错效果。

步骤S27015d，若所述纠错后的通用机器学习模型文件的校验码与所述预设标准码一致，则在所述通用机器学习模型文件中读取模型目录。可以理解地，若纠错后的通用机器学习模型文件的校验码与预设标准码一致，则可判断纠错后的通用机器学习模型已经无误。

在另一个实施例中，所述通用机器学习模型文件解析方法还包括：若所述纠错后的通用机器学习模型文件的校验码与所述预设标准码不一致，则所述方法停止执行。可以理解地，纠错后的通用机器学习模型文件的校验码与预设标准码仍不一致，则可判断纠错失败，纠错后的通用机器学习模型仍有误。

在一个实施例中，请一并参阅图25，步骤S2703，根据所述模型目录，读取目标通用机器学习模型包括：

步骤S27031，获取目标通用机器学习模型的在所述通用机器学习模型文件中的存储偏移量。其中，存储偏移量是指每个通用机器学习模型在通用机器学习模型文件中的存储的相对位置。例如模型A、模型B与模型C依次从文件头到文件尾存储，模型A的大小为2比特,模型B的大小为3比特,模型C的大小为1比特，则模型A的偏移量为0，模型B的偏移量为2比特，模型C的偏移量为2+3＝5比特。

步骤S27032，根据所述存储偏移量，读取所述目标通用机器学习模型。在其中一个实施例中，根据存储偏移量，得到目标通用机器学习模型在目标通用机器学习模型文件的位置，进一步地根据目标通用机器学习模型文件的位置读取目标通用机器学习模型。

在一个实施例中，请一并参阅图26，提供了一种通用机器学习模型文件解析方法，包括：

步骤S2801，获取通用机器学习模型文件。具体地，步骤S2801的执行过程与上述步骤S2701的步骤相同，在此不再赘述。

步骤S2802，在所述通用机器学习模型文件中读取二级模型目录。具体地，在本实施例中通用机器学习模型文件中存储的是二级模型文件。具体地，本实施例中的二级模型以及二级模型目录可以上述通过步骤S2501-步骤S2505生成。

步骤S2803，根据所述二级模型目录，读取目标二级模型。在其中一个实施例中，获取目标二级模型的在所述通用机器学习模型文件中的存储偏移量；根据所述存储偏移量，读取所述目标二级模型。其中，目标二级模型是指在通用机器学习模型文件中所要取出的通用机器学习模型。

步骤S2804，对所述目标二级模型进行还原得到目标通用机器学习模型。具体地，二级模型是经过存储优化处理的通用机器学习模型。在其中一个实施例中，根据存储优化处理的操作对二级模型进行还原。例如，若存储优化处理是加密，则还原操作是对二级模型进行解密；又例如，若存储优化处理是压缩，则还原操作是对二级模型进行解压缩。可以理解地，若存储优化处理是加密以及压缩，则还原操作是解密以及解压缩。

在一个实施例中，请一并参阅图27，通用机器学习模型文件解析方法还包括:

步骤S2901，读取所述通用机器学习模型中的硬件参数信息。具体地，硬件参数信息是指，执行通用机器学习模型时所需要的硬件信息。

步骤S2902，根据所述硬件参数信息，生成硬件匹配信息。具体地，根据硬件参数信息，在设备池中匹配符合硬件参数信息的硬件。在其中一个实施例中，设备池可以是不同硬件平台中的设备，通过在设备池中匹配硬件参数信息使得通用机器学习模型的解析过程或执行过程能够跨平台实现。例如，根据硬件参数信息一个通用机器学习模型文件需要一个CPU和一个GPU实现，但是本平台中无GPU只有一个CPU，那么在设备池中寻找另一个平台中有GPU，则连接设备池中不同平台中的硬件设备以完成该通用机器学习模型的执行。

在一个实施例中，请一并参阅图22，通用机器学习模型文件解析方法还包括：

步骤S2903，对所述通用机器学习模型进行分类拆解，得到栈区数据和堆区数据。具体的，分类拆解的依据是根据数据类型的不同进行拆解。具体地，栈数据是指在多核开发平台中不可核间共享的数据，堆数据是指在多核开发平台中能够进行核间共享的数据。在一个实施例中，步骤S2903所述对所述通用机器学习模型进行分类拆解，得到栈数据和堆数据的步骤包括：步骤S29031，将所述通用机器学习模型中可共享的数据拆解为栈数据；步骤S29032，将所述通用机器学习模型中不可共享的数据拆解为堆数据。

步骤S2904，根据所述栈区数据、所述堆区数据以及输入数据计算，得到输出数据。在其中一个实施例中，所述方法还包括将所述栈数据分配到栈区；

具体的，栈区是指内存中主要存储栈数据的存储空间。可选的，栈区中存储的数据还包括机器学习运算过程中所产生的中间结果。在其中一个实施例中，所述方法还包括将所述堆数据分配到堆区；具体的，堆区是指内存中主要存储堆数据的存储空间。可选的堆区中存储的数据还包括机器学习运算过程中所产生的中间结果。具体的，堆区数据包括存储在堆区的数据，例如堆数据以及各堆数据块布局信息。

应该理解的是，虽然图9、图11-18以及图21-28的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图9、图11-18以及图21-28中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，请一并参阅图29，提供了一种通用机器学习模型文件解析装置，包括：

文件获取器2901，目录解析器2902以及模型读取器2903；所述目录解析器2902分别与所述文件获取器2901、以及所述模型读取器2903相连；

所述文件获取器2901，用于获取通用机器学习模型文件；

所述目录解析器2902，用于在所述通用机器学习模型文件中读取模型目录；

所述模型读取器2903，用于根据所述模型目录，读取目标通用机器学习模型。

在一个实施例中，所述文件获取器2901包括文件头校验器29011；

所述文件头校验器29011用于获取所述通用机器学习模型文件的标识码；并检测所述标识码是否符合预设规则；若所述文件头中的标识码合法，则在所述通用机器学习模型文件中读取模型目录；所述文件头校验器还用于：

获取所述通用机器学习模型文件的校验码；以及校验所述校验码与预设标准码是否一致，若所述校验码与预设标准码不一致，则执行纠错运算。

在一个实施例中，所述文件获取器2901还包括文件尾纠正器29012；

所述文件尾纠正器29012用于获取所述文件尾的纠错码；还用于根据所述纠错码对所述通用机器学习模型文件进行纠错，得到纠错后的模型文件；以及用于校验所述纠错后的模型文件的校验码与所述预设标准码预生成的校验码是否一致；若所述纠错后的模型文件的校验码与所述预设标准码一致预生成的校验码一致，则在所述通用机器学习模型文件中读取模型目录。

在其中一个实施例中，所述文件尾纠正器29012还用于若所述纠错后的模型文件的校验码与所述预设标准码不一致，则所述方法停止执行。

在一个实施例中，所述模型读取器2903还具体用于获取目标通用机器学习模型的在所述通用机器学习模型文件中的偏移量；以及根据所述偏移量，读取所述目标通用机器学习模型。

在一个实施例中，所述通用机器学习模型文件解析装置还包括模型分发器2904，所述模型分发器2904与所述目录解析器2902相连。在其中一个实施例中，所述模型分发器2904用于在所述通用机器学习模型文件中读取二级模型目录；并根据所述二级模型目录，读取目标二级模型；并对所述目标二级模型进行解析，得到通用机器学习模型。

在一个实施例中，所述通用机器学习模型文件解析装置还包括硬件匹配器2905，所述硬件匹配器2905与所述模型读取器2903相连；所述硬件匹配器用于读取所述通用机器学习模型中的硬件参数信息；以及用于根据所述硬件参数信息，在设备池中匹配对应硬件。

在一个实施例中，所述通用机器学习模型文件解析装置与所述通用机器学习执行装置29100相连，请一并参阅图30，所述通用机器学习执行装置包括：

模型获取器29101，用于获取通用机器学习模型；

模型拆解器29102，用于对所述通用机器学习模型进行分类拆解，得到栈区数据和堆区数据；

结果输出器29103，用于获取所述栈区数据和所述堆区数据、以及输入数据进行计算，得到输出数据。

关于通用机器学习模型文件解析装置的具体限定可以参见上文中对于通用机器学习模型文件解析方法的限定，在此不再赘述。上述通用机器学习模型文件生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图31所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时实现一种通用机器学习模型文件生成方法和/或通用机器学习模型文件解析方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图31中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以上任一实施例所提供方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以上任一实施例中所提供的方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种通用机器学习模型的生成方法，所述方法包括：

获取机器学习任务的任务参数；

对所述任务参数进行分类处理，得到任务指令及模型参数；

根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据；

将所述栈数据和堆数据进行整合，得到通用机器学习模型。
根据权利要求1所述的方法，其特征在于，所述任务参数包括算法控制参数和计算参数；

所述对所述任务参数进行分类处理，得到任务指令及模型参数的步骤包括：

对所述算法控制参数进行编译，得到任务指令；

对所述计算参数进行分类处理，得到模型参数。
根据权利要求2所述的方法，其特征在于，所述对所述计算参数进行分类处理，得到模型参数的步骤包括：

对所述计算参数进行预处理，得到预处理模型数据；

根据所述计算参数获取硬件参数；

提取所述计算参数中的数据属性参数。
根据权利要求3所述的方法，其特征在于，所述根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据的步骤包括：

对所述任务指令进行分类处理，得到任务指令堆数据；

根据所述数据类型对模型参数进行分类处理，得到模型参数栈数据及模型参数堆数据；

对所述模型参数栈数据进行汇集，得到所述栈数据；

对所述模型参数堆数据和任务指令堆数据进行汇集，得到所述堆数据。
根据权利要求4所述的方法，其特征在于，所述根据所述数据类型对模型参数进行分类处理，得到模型参数栈数据及模型参数堆数据的步骤包括：

根据共享属性对所述模型参数进行分类，得到可共享模型参数及不可共享模型参数；

对可共享模型参数进行汇集，得到模型参数堆数据；

对所述不可共享模型参数进行汇集，得到模型参数栈数据。
根据权利要求4所述的方法，其特征在于，所述模型参数堆数据包括模型参数静态数据和模型参数动态数据；

所述将所述栈数据和堆数据进行整合，得到通用机器学习模型的步骤包括：

将所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到连续的静态数据块；

对所述模型参数动态数据进行打包整合，得到连续的动态数据块；

对所述模型参数栈数据进行打包整合，得到栈数据块；

对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型。
根据权利要求6所述的方法，其特征在于，所述对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型的步骤包括：

根据所述任务指令获取静态数据布局信息、动态数据布局信息以及栈数据布局信息；

根据所述静态数据布局信息对所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到所述连续的静态数据块；

根据所述动态数据布局信息对所述模型参数动态数据进行打包整合，得到连续的动态数据块；

根据所述栈数据布局信息对所述模型参数栈数据进行打包整合，得到所述栈数据块；

对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行整合。
根据权利要求7所述的方法，其特征在于，所述提取所述计算参数中的数据属性参数的步骤包括：

获取计算参数的输入数据属性、输出数据属性及中间结果临时空间属性；

在所述输入数据的属性中提取所述输入数据的数据量，并分配所述输入数据存储空间；

在所述输出数据的属性中提取所述输出数据的数据量，并分配所述输出数据存储空间；

在所述中间结果临时空间属性中提取中间结果临时空间的数据量，并分配所述中间结果临时存储空间；

将所述输入数据存储空间及输出数据存储空间存储为堆数据，将所述中间结果临时空间存储为栈数据。
根据权利要求8所述的方法，其特征在于，所述根据所述栈数据布局信息对所述模型参数栈数据进行打包整合，得到所述栈数据块的步骤包括：

根据所述栈数据布局信息对所述不可共享模型参数、所述中间结果临时空间数据进行整合，得到所述栈数据块。
根据权利要求9所述的方法，其特征在于，所述根据所述计算参数获取硬件参数的步骤包括：

获取硬件平台信息以及硬件配置参数并存储为堆数据。
根据权利要求10所述的方法，其特征在于，所述根据所述静态数据布局信息对所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到所述连续的静态数据块的步骤包括：

根据所述静态数据布局信息，对所述任务指令堆数据、模型参数堆数据、硬件平台信息以及硬件配置参数进行整合，得到所述连续的静态数据块。
根据权利要求8所述的方法，其特征在于，所述根据所述动态数据布局信息对所述模型参数动态数据进行打包整合，得到连续的动态数据块的步骤包括：

根据所述动态数据布局信息对所述输入数据存储空间以及所述输出数据存储空间进行整合，得到所述连续的动态数据块。
一种通用机器学习模型的生成装置，其特征在于，所述装置包括：

对外接口模块，用于获取机器学习任务的任务参数；

分类处理模块，用于对所述任务参数进行分类处理，得到任务指令及模型参数；

参数汇集模块，用于根据数据类型将所述任务指令及模型参数进行汇集，得到栈数据和堆数据；

模型生成模块，用于将所述栈数据和堆数据进行整合，得到通用机器学习模型。
根据权利要求13所述的装置，其特征在于，所述任务参数包括算法控制参数和计算参数；

所述分类处理模块包括：

任务指令生成模块，用于对所述算法控制参数进行编译，得到任务指令；

模型参数生成模块，对所述计算参数进行分类处理，得到模型参数。
根据权利要求14所述的装置，其特征在于，所述模型参数生成模块包括：

模型参数栈数据生成模块，用于对可共享模型参数进行汇集，得到模型参数栈数据；

模型参数堆数据生成模块，用于对所述不可共享模型参数进行汇集，得到模型参数堆数据。
根据权利要求15所述的装置，其特征在于，所述模型参数堆数据生成模块包括：

模型参数静态数据生成模块，用于对静态的所述模型参数堆数据进行汇集，得到模型参数静态数据；

模型参数动态数据生成模块，用于对动态的所述模型参数堆数据进行汇集，得到模型参数动态数据。
根据权利要求15所述的装置，其特征在于，所述模型参数生成模块还包括：

预处理模块，用于对所述计算参数进行预处理，得到预处理模型数据；

硬件参数生成模块，用于根据所述计算参数获取硬件参数；

属性提取模块，用于提取所述计算参数中的数据属性参数。
根据权利要求17所述的装置，其特征在于，所述任务指令包括任务指令堆数据；所述参数汇集器包括：

栈数据汇集器，用于对所述模型参数栈数据进行打包整合，得到栈数据块；

模型参数动态数据汇集器，用于对所述模型参数动态数据进行打包整合，得到连续的动态数据块；

模型参数静态数据汇集器，用于将所述任务指令堆数据与所述模型参数静态数据进行打包整合，得到连续的静态数据块。
根据权利要求18所述的装置，其特征在于，所述模型生成模块用于对所述连续的静态数据块、所述连续的动态数据块以及栈数据块进行合并，得到通用机器学习模型。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。