WO2021134350A1

WO2021134350A1 - 神经网络模型的推理方法、装置、计算机设备和存储介质

Info

Publication number: WO2021134350A1
Application number: PCT/CN2019/130183
Authority: WO
Inventors: 庄奇
Original assignee: 深圳元戎启行科技有限公司
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2021-07-08
Also published as: CN113811897B; CN113811897A

Abstract

一种神经网络模型的推理方法，包括：获取模型推理任务，所述模型推理任务携带模型标识（202）；解析所述模型标识对应的神经网络模型，得到所述神经网络模型对应的原模型网络（204）；获取预设的与所述模型标识对应的标准子网络（206）；根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络（208）；基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型（210）；及根据所述优化后的神经网络模型进行推理，得到模型推理结果（212）。

Description

神经网络模型的推理方法、装置、计算机设备和存储介质

技术领域

本申请涉及一种神经网络模型的推理方法、装置、计算机设备和存储介质。

背景技术

人工神经网络是从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。神经网络模型在语音识别、图像识别以及自然语言处理等领域均有着广泛的应用。随着计算机技术的发展，神经网络模型的网络结构愈发复杂，层数由最初的几十层发展至上千层甚至更多。

发明人意识到，随着神经网络模型的网络结构变得更多更复杂，推理神经网络模型，即输入数据运行整个神经网络模型得到输出数据的过程需要耗费更多的时间。因此，如何减少神经网络模型的推理时间，提高推理速度成为目前需要解决的技术问题。

发明内容

根据本申请公开的各种实施例，提供一种神经网络模型的推理方法、装置、计算机设备和存储介质。

一种神经网络模型的推理方法包括：

获取模型推理任务，所述模型推理任务携带模型标识；

解析所述模型标识对应的神经网络模型，得到所述神经网络模型对应的原模型网络；

获取预设的与所述模型标识对应的标准子网络；

根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络；

基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型；及

根据所述优化后的神经网络模型进行推理，得到模型推理结果。

一种神经网络模型的推理装置包括：

任务获取模块，用于获取模型推理任务，所述模型推理任务携带模型标识；

模型解析模块，用于解析所述模型标识对应的神经网络模型，得到所述神经网络模型对应的原模型网络；

模型遍历模块，用于获取预设的与所述模型标识对应的标准子网络；根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络；

模型优化模块，用于基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型；及

模型推理模块，用于根据所述优化后的神经网络模型进行推理，得到模型推理结果。

一种计算机设备，包括存储器和一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取模型推理任务，所述模型推理任务携带模型标识；

获取预设的与所述模型标识对应的标准子网络；

一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

获取模型推理任务，所述模型推理任务携带模型标识；

获取预设的与所述模型标识对应的标准子网络；

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为根据一个或多个实施例中神经网络模型的推理方法的应用场景图。

图2为根据一个或多个实施例中神经网络模型的推理方法的流程示意图。

图3为根据一个或多个实施例中原模型网络的局部抽象图。

图4为一个实施例中基于标准子网络所对应的目标子网络将待优化子网络进行优化，得到优化后的神经网络模型步骤的流程示意图。

图5为根据一个或多个实施例中神经网络模型的推理装置的框图。

图6为根据一个或多个实施例中计算机设备的框图。

具体实施方式

为了使本申请的技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的神经网络模型的推理方法，可以应用于终端，也可以应用于服务器。以应用于终端为例，终端可以获取模型推理任务，模型推理任务携带模型标识。终端解析模型标识对应的神经网络模型，得到神经网络模型对应的原模型网络。终端获取预设的与模型标识对应的标准子网络，根据标准子网络对原模型网络进行遍历，得到待优化子网络。终端基于标准子网络所对应的目标子网络将待优化子网络进行优化，得到优化后的神经网络模型。终端根据优化后的神经网络模型进行推理，得到模型推理结果。终端具体可以包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑。

可以理解的，本申请提供的神经网络模型的推理方法实现对神经网络模型进行推理，可以应用于多种应用环境，神经网络模型可以包括多种类型。例如，神经网络模型可以包括卷积神经网络模型、循环神经网络模型以及递归神经网络模型等。神经网络模型可以用于处理多种不同的数据。例如，神经网络模型具体可以包括图像识别模型、特征提取模型、语音识别模型、文本识别模型以及场景分类模型等。

在其中一个实施例中，本申请提供的神经网络模型的推理方法具体可以应用于自动驾驶领域中，神经网络模型具体可以包括图像识别模型、行为预测模型或者风险评估模型等中的至少一种。例如，神经网络模型可以是图像识别模型，本申请提供的神经网络模型的推理方法可以应用与如图1所示的应用环境中。自动驾驶车辆可以包括传感器102和终端104，传感器102可以通过与终端104建立的连接与终端104进行通信。传感器102可以采集视觉范围内的环境图像。比如在自动驾驶车辆行驶至路口时，传感器102可以采集交通信号灯图像。终端104根据传感器102采集的信号灯图像进行图像识别，判断图像中信号灯的颜色。具体的，终端104可以根据图像识别任务生成模型推理任务，模型推理任务携带了需要调用的图像识别模型对应的模型标识。终端104可以根据模型标识获取属于图像识别模型的神经网络模型，对图像识别模型进行解析，得到图像识别模型对应的原模型网络。终端104获取预设的标准图像识别子网络，根据标准图像识别子网络对原模型网络进行遍历，得到图像识别模型中的待优化子网络。终端104基于标准图像识别子网络所对应的目标图像识别子网络，将图像识别模型中的待优化子网络进行优化，得到优化后的图像识别模型。终端104根据优化后的图像识别模型对信号灯图像进行运算推理，得到信号灯图像中信号灯的颜色。

在其中一个实施例中，当对得到模型推理结果的实时性要求较低，或者根据神经网络模型推理的数据量较大时，上述神经网络模型的推理方法还可以应用于服务器中。例如，本申请提供的神经网络模型的推理方法具体可以应用于自然语言处理领域中，神经网络模型具体可以是文本分类模型。具体的，终端可以向服务器上传文本分类请求，服务器根据文本分类请求对待分类文本进行分类处理。当需要通过文本分类模型对待分类文本进行分类运算时，服务器可以生成模型推理任务，模型推理任务携带了需要调用的文本分类模型对应的模型标识。服务器可以根据模型标识获取预先配置的文本分类模型，对文本分类模型进行解析，得到文本分类模型对应的原模型网络。服务器可以获取预设的与模型标识对应的标准分类子网络，根据标准分类子网络对原模型网络进行遍历，得到文本分类模型对应的待优化子网络。服务器可以基于标准分类子网络对应的目标分类子网络，将待优化子网络进行优化，得到优化后的文本分类模型。服务器可以根据优化后的文本分类模型对输入的待分类文本进行推理，得到文本分类结果。

在其中一个实施例中，如图2所示，提供了一种神经网络模型的推理方法，以该方法应用于终端为例进行说明，包括以下步骤：

步骤202，获取模型推理任务，模型推理任务携带模型标识。

模型推理是指根据神经模型的网络结构顺序，依次按照包括的多个计算层各自对应的操作，对输入神经网络模型的数据进行运算，以此得到神经网络模型输出的推理结果。终端可以获取模型推理任务，根据模型推理任务对相应的神经网络模型进行推理。

具体的，终端可以在用户需要进行模型推理时，根据接收到用户的操作指令确定用户指定的神经网络模型，生成携带模型标识的模型推理任务。终端也可以根据实际运行需求确定需要调用的神经网络模型，生成模型推理任务。例如，在图像识别的过程中，当需要调用图像识别模型对图像进行识别处理时，终端可以生成模型推理任务，根据模型推理任务在输入图像后对图像识别模型进行推理，得到图像识别模型输出的识别结果。

模型推理任务中携带有模型标识。模型标识是指神经网络模型对应的标记标识，用于对神经网络模型进行标记，神经网络模型存在唯一对应的模型标识。在其中一个实施例中，终端可以包括推理引擎，终端可以通过推理引擎执行模型推理任务，对模型标识对应的神经网络模型进行推理。推理引擎是指终端中用于完成推理的功能模块。

步骤204，解析模型标识对应的神经网络模型，得到神经网络模型对应的原模型网络。

终端可以对获取到的模型推理任务进行解析，得到模型推理任务中携带的模型标识。终端可以根据模型推理任务获取模型标识对应的神经网络模型。神经网络模型可以是预先训练得到的，并且配置在终端。神经网络模型可以存储在终端对应的内存或存储器中。模型标识对应的神经网络模型可以包括多种不同的神经网络模型中的至少一种。例如，根据神经网络模型的网络结构的不同，具体可以包括卷积神经网络模型(Convolutional Neural Networks，简称CNN)、循环神经网络模型(RecurrentNeural Network，简称RNN)以及递归神经网络模型等中的至少一种。根据神经网络模型的功能不同，神经网络模型具体可以包括图像识别模型、特征提取模型、语音识别模型、文本识别模型以及场景分类模型等中的至少一种。

终端可以根据模型推理任务从比如内存等存储位置，读取模型标识对应的神经网络模型，对读取到的神经网络模型进行解析，得到神经网络模型对应的原模型网络。原模型网络是指终端读取到的神经网络模型对应的神经网络结构。神经网络模型可以包括多个计算层，每个计算层可以对应数据操作。计算层与计算层之间可以存在条件或关联关系。例如，一些计算层的输出可以为对应计算层的输入。神经网络模型包括的计算层以及计算层之间的关联关系构成了神经网络模型对应的原模型网络。在原模型网络中，计算层与计算层之间的关联关系以及先后顺序都是固定的，对于不同的神经网络模型可以有对应不同的网络结构。例如，在卷积神经网络模型中，具体可以包括输入层、卷积层、池化层、全连接层以及输出层等。

终端将解析得到的原模型网络采用多种形式表示。例如，终端可以采用列表的形式记录解析得到的原模型网络，列表的顺序可以表示原模型网络中计算层与计算层之间的关联关系。终端也可以根据原模型网络的结构生成对应的抽象图。如图3所示，图3为原模型网络所对应抽象图中的局部抽象图。由于完整的神经网络模型对应的原模型网络较为庞大，因此以局部的抽象图为例说明。原模型网络对应的抽象图为有向图，神经网络模型中的计算层与抽象图中的节点相对应。节点与节点之间的有向边表示计算层与计算层之间的输入输出关系，计算层输出的数据可以根据有向边输入至箭头指向的计算层。每个节点可以包括对应计算层的计算层信息，计算层信息包括计算层对应的计算层标识、计算层类型、计算层属性以及计算层条件等中的至少一种。对应的，终端可以确定计算层信息作为对应节点的节点信息。

步骤206，获取预设的与模型标识对应的标准子网络。

终端可以获取与模型标识相对应的标准子网络，神经网络模型的模型标识可以对应一个或多个标准子网络。标准子网络可以是用户根据实际需求预先设置的，用户可以根据神经网络模型的原模型网络，确定可以进行优化的子网络作为标准子网络。终端可以接收用户通过输入设备输入的标准子网络。标准子网络为完整的神经网络模型的局部网络结构，标准子网络可以包括多个计算层以及多个计算层之间的关联关系，计算层之间的关联关系具体可以包括计算层之间的逻辑条件和输入输出关系。标准子网络可以是用户预先设置后存储在终端中的，标准子网络可以是神经网络模型中原模型网络的子集。与原模型网络对应的，标准子网络也可以采用多种形式表示。例如，终端可以采用列表的形式记录和表示标准子网络，列表中的每一行可以记录标准子网络中的计算层，列表的顺序可以表示计算层与计算层之间的关联关系。终端还可以根据标准子网络生成抽象图，采用抽象图的形式表示标准子网络。

步骤208，根据标准子网络对原模型网络进行遍历，得到待优化子网络。

终端可以根据预设的标准子网络对原模型网络进行遍历，在原模型网络中筛选出与标准子网络相对应的待优化子网络。待优化子网络是指原模型网络中可以进行优化处理的部分网络。在神经网络模型中，包括大量计算层，网络结构较为复杂，终端在推理神经网络模型时需要耗费较长时间，模型推理的速度较低，不利于对实时性要求较高的数据处理过程。例如，在自动驾驶领域中，需要快速根据神经网络模型推理得到数据处理结果。而且，终端在每根据一个计算层对应的操作进行数据处理后，需要将处理得到的数据暂存在内存中。由于神经网络模型的计算层较多，会占用较大的内存空间。因此，终端可以根据标准子网络从原模型网络中遍历出待优化子网络，以便对神经网络模型的原模型网络进行优化，减少原模型网络中的计算层数。

具体的，终端可以根据标准子网络中计算层的顺序，依次对原模型网络中的计算层进行遍历，查找与标准子网络计算层相对应的计算层。当找到相对应的计算层时，确定与标准子网络中计算层相对应的计算层为待优化计算层，原模型网络中的位置不变，向下继续查找与标准子网络中下一个计算层相对应的待优化计算层，直到查找出所有待优化计算层。终端可以将待优化计算层所构成的网络记作待优化子网络，待优化子网络为原模型网络的子集。

例如，标准子网络和原模型网络可以采用抽象图的形式表示。终端可以按照抽象图顺序获取标准子网络中的标准节点，按照原模型网络的顺序逐一将原模型网络抽象图中的原模型节点与标准节点进行比对。终端可以将比对成功的原模型节点记作待优化节点，保持原模型网络抽象图的位置不变，获取下一个标准节点，继续向下比对标准节点和原模型节点，重复查找与标准节点相对应的原模型节点，直到在原模型网络中查找出与所有标准节点分别对应的待优化节点。终端可以将待优化节点所构成的网络记作待优化子网络。在标准子网络中，多个标准节点之间是连续的。而在待优化子网络中，待优化节点之间可以是连续的，也可以是不连续的，即待优化子网络的待优化节点之间可以包括不属于待优化节点的原模型节点。

步骤210，基于标准子网络所对应的目标子网络将待优化子网络进行优化，得到优化后的神经网络模型。

步骤212，根据优化后的神经网络模型进行推理，得到模型推理结果。

终端可以对遍历出的待优化子网络进行优化，得到优化后的神经网络模型，以此提高神经网络模型的推理速度，减少神经网络模型的推理时间。同时，优化后的神经网络模型相较于原神经网络模型简化了原模型网络，减少了计算层的层数，避免多个计算层的输出结果不必要的占用终端的内存。

具体的，终端可以获取与标准子网络相对应的目标子网络。目标子网络可以是用户根据实际需求预先设置的，目标子网络与标准子网络存在唯一对应的映射关系。目标子网络是指对标准子网络进行优化处理后得到的网络结构。终端可以根据目标子网络对原模型网络中的待优化子网络进行优化处理，得到优化后的神经网络模型。终端具体可以获取待优化子网络所对应的至少一个输入节点，以及至少一个输出节点。终端可以从原模型网络中删除待优化子网络，将待优化子网络所对应的输入节点和输出节点分别与目标子网络连接，以此将待优化子网络替换为目标子网络，得到优化后的神经网络模型。目标子网络相较于待优化子网络简化了网络结构，减少了计算层层数，进而简化了神经网络模型。终端可以基于优化后的神经网络模型进行推理，按照优化后的神经网络模型所对应的计算层操作依次进行运算，得到推理出的数据结果。例如，终端可以基于优化后的图像识别模型，按照优化后的网络结构所对应的操作顺序依次对输入的图像进行运算，得到识别出的图像结果。

在本实施例中，终端在获取到模型推理任务需要对神经网络模型进行推理时，解析模型标识所对应的神经网络模型，得到神经网络模型的原模型网络。终端可以获取预设的标准子网络，根据标准子网络对原模型网络进行遍历，以此在原模型网络中筛选出可以进行优化的待优化子网络。终端基于目标子网络将待优化子网络进行优化，得到优化后的神经网络模型。终端在推理神经网络模型之前，对神经网络模型的网络结构进行优化，不影响神经网络模型的训练梯度，保证神经网络模型的准确性。终端根据优化后的神经网络模型进行推理，简化了神经网络模型的网络结构，减少了神经网络模型中的计算层，从而有效的提高了神经网络模型的推理速度，节省了神经网络模型的推理时间，提高了模型推理的实时性。

在其中一个实施例中，在获取预设的与模型标识对应的标准子网络之前，上述神经网络模型的推理方法还包括：获取标准节点关联文件；根据标准节点关联文件生成网络描述脚本；执行网络描述脚本，生成标准子网络。

终端在获取预设的标准子网络之前，还包括根据实际需求生成标准子网络。具体的，终端可以获取标准节点关联文件，标准节点关联文件是用于记录标准节点以及标准节点之间关联关系的模板文件。用户可以按照模板文件的特定格式输入标准子网络的网络结构，得到标准节点关联文件。标准节点用于表示标准子网络中的计算层，每个计算层对应一个节点。

标准节点关联文件具体可以包括标准节点文件和节点条件文件。标准节点文件以及节点条件文件可以按照特定格式记录标准节点。例如，标准节点文件可以是数据表形式的标准节点列表，列表中的每一行记录一个标准节点，列表的顺序可以表示标准节点的逻辑顺序和关联关系。节点条件文件也可以是数据表形式的节点条件列表，列表中的每一行记录标准节点所需要满足的逻辑条件。

在其中一个实施例中，标准节点列表每一行的标准节点可以记录为“标准节点标识＝标准节点类型([输入节点标识]，[标准节点属性])”。其中，输入节点标识可以包括一个或多个输入节点对应的节点标识，标准节点属性可以包括标准节点对应的至少一个节点属性。例如，标准节点列表中的其中一个标准节点具体可以为“layer_2＝concat([layer_0，layer_1]，[dim＝1])”。其中， “layer_0”、“layer_1”以及“layer_2”分别表示标准节点对应的节点标识，节点标识为“layer_2”的标准节点的类型“concat”为连接标准节点“layer_0”和标准节点“layer_1”，标准节点“layer_2”的节点属性dim等于1。

标准节点列表中可以包括至少两个标准节点标识。节点条件列表中节点条件的特定格式可以表示为“条件标识＝逻辑表达式([标准节点标识]，[标准节点属性])”。其中，节点条件列表中可以包括多个条件各自对应的条件标识，标准节点标识可以至少两个标准节点各自对应的节点标识，标准节点属性是指与标准节点相对应的节点属性。例如，节点条件列表中的其中一个节点条件具体可以为“Condition_0＝eq(layer_3.dim，layer_4.dim)”。其中，条件标识为“Condition_0”的节点条件表示标准节点“layer_3”的属性dim要与标准节点“layer_4”的属性dim相等。当两个标准节点的属性dim相等时，满足节点条件“Condition_0”，否则不满足。

终端可以根据标准节点关联文件的特定格式，读取标准节点关联文件中标准节点对应的节点信息，根据节点信息生成网络描述脚本。终端可以执行生成的网络描述脚本，通过运行网络描述脚本生成标准子网络。标准子网络可以用于表示神经网络模型中可以进行优化的部分网络结构，终端可以基于生成的标准子网络对神经网络模型的原模型网络进行优化，以此简化原模型网络的网络结构，提高神经网络模型的推理速度。

在本实施例中，终端可以获取标准节点关联文件，根据标准节点关联文件中记载的标准节点信息生成网络描述脚本，执行网络描述脚本以此生成标准子网络。终端根据标准节点关联文件可以灵活的生成标准子网络，进而提高了待优化子网络的灵活性和多样性。通过标准子网络有助于筛选出更加复杂的待优化子网络，从而对神经网络模型的网络结构进行深度优化，有效的提高了神经网络模型的推理速度，节省推理神经网络模型时占用的内存。

在其中一个实施例中，根据标准子网络对原模型网络进行遍历，得到待优化子网络的步骤包括：将标准子网络和原模型网络分别进行拓扑排序，得到标准节点序列和原模型节点序列；根据标准节点序列与原模型节点序列中的原模型节点进行匹配，得到待优化节点；根据待优化节点生成待优化子网络。

终端可以基于标准子网络对原模型网络进行遍历，从原模型网络中筛选出与标准子网络相对应的待优化子网络。具体的，终端可以将标准子网络和原模型网络分别进行拓扑排序，得到标准子网络所对应的标准节点序列，以及原模型网络所对应的原模型节点序列。拓扑排序是指将有向网络中的节点排成满足拓扑次序的序列，拓扑排序所得到的序列为一维的线性序列。终端可以将标准子网络拓扑排序得到的线性序列记作标准节点序列，将原模型网络拓扑排序得到的线性序列记作原模型节点序列。终端进行拓扑排序得到的线性序列中节点之间的顺序是固定的。

终端可以根据标准节点序列与原模型节点序列中的原模型节点进行匹配，得到待优化节点，根据待优化节点生成待优化子网络。可以理解的，当终端获取到多个预设的标准子网络时，终端可以将多个标准子网络所对应的标准节点序列分别与原模型节点序列进行匹配，从原模型网络中筛选出与多个标准子网络分别对应的待优化子网络。

具体的，终端可以按照标准节点序列的顺序，依次获取标准节点。终端按照原模型节点序列的顺序，对原模型节点序列中的多个原模型节点进行遍历，依次判断原模型节点与标准节点是否匹配。当原模型节点与标准节点相匹配时，终端可以将与标准节点相匹配的原模型节点记作待优化节点，并且获取标准节点序列中的下一个标准节点，重复将标准节点与后续的原模型节点进行匹配，直到在原模型节点中筛选出与所有标准节点相匹配的待优化节点，或者遍历完原模型节点序列中的所有原模型节点。终端可以获取原模型节点序列中所有与标准节点相匹配的待优化节点，确定由待优化节点所构成的网络作为待优化子网络。在标准子网络中，标准节点之间是连续的。而在待优化子网络中，待优化节点之间可以是连续的，也可以是不连续的，部分待优化节点可以离散分布在原模型网络中。

在其中一个实施例中，当原模型节点与标准节点不匹配时，终端可以按照原模型节点序列的顺序，获取下一个原模型节点与标准节点进行匹配。当原模型节点序列中不存在与标准节点相匹配的原模型节点时，终端可以根据原神经网络模型进行推理，并且生成优化失败提示信息。终端可以通过显示界面展示优化失败提示信息，以此提示用户预设的标准子网络与模型标识所对应的神经网络模型不对应，未对神经网络模型的推理过程进行优化。

在本实施例中，终端通过将标准子网络和原模型网络分别进行拓扑排序，得到各自对应的标准节点序列和原模型节点序列，拓扑序列准确的表示了节点在网络结构中的顺序，从而准确的筛选出原模型节点序列中的待优化节点。终端根据标准节点序列从原模型节点序列中筛选出待优化节点，生成待优化子网络，有助于对待优化子网络进行优化，根据优化后的神经网络模型进行推理，有效的提高了神经网络模型的推理速度，节省了推理所需耗费的时间。

在其中一个实施例中，根据标准节点序列与原模型节点序列中的原模型节点进行匹配，得到待优化节点的步骤包括：根据标准节点序列获取标准节点对应的标准节点信息；基于标准节点信息依次对原模型节点序列中的原模型节点进行遍历，确定与标准节点信息匹配的原模型节点作为待优化节点。

终端可以按照标准节点序列的顺序依次在原模型节点序列中筛选出与标准节点相匹配的待优化节点。具体的，终端可以获取标准节点对应的标准节点信息，标准节点对应的标准节点信息具体可以包括标准节点标识、标准节点类型、标准节点属性以及标准节点条件等。对应的，原模型节点对应有包括原模型节点标识、原模型节点类型、原模型节点属性以及原模型节点条件等原模型节点信息。终端基于标准节点信息对原模型节点进行遍历，依次判断标准节点信息与原模型节点信息是否匹配。若是，则将相匹配的原模型节点记作待优化节点，获取下一个标准节点对应的标准节点信息进行匹配。若否，则重复判断下一个原模型节点对应的原模型节点信息与标准节点信息是否匹配。

终端可以将节点信息中的多种信息依次进行匹配。当标准节点对应的全部标准节点信息与原模型节点信息匹配时，确定标准节点与原模型节点相匹配。当标准节点对应的任一标准节点信息与原模型节点信息不匹配时，确定标准节点与原模型节点不匹配。

举例说明，终端可以获取标准节点对应的标准节点类型，按照原模型节点序列依次遍历与标准节点类型相匹配的原模型节点。当原模型节点序列中不存在原模型节点类型与标准节点类型相匹配时，确定原模型节点序列中不存在与标准节点相匹配的原模型节点。当遍历到与标准节点类型相匹配的原模型节点类型时，终端获取原模型节点对应的原模型节点属性，将原模型节点属性与标准节点属性进行比对。当原模型节点属性与标准节点属性不匹配时，终端重复将标准节点类型与下一个原模型节点类型进行比对。当原模型节点属性与标准节点属性匹配时，终端获取标准节点以及原模型节点各自对应的至少一个原输入节点，原输入节点之间存在固定的拓扑顺序。终端可以根据原输入节点之间的拓扑顺序依次将标准节点和原模型节点各自对应的原输入节点进行比对。当原输入节点之间的类型不同时，终端重复将标准节点类型与下一个原模型节点类型进行比对。当标准节点对应的原输入节点为空节点时，确定原模型节点对应的原输入节点作为待优化子网络的输入节点。当所有原输入节点相匹配时，终端可以获取标准节点条件和原模型节点条件。同理，当标准节点条件与原模型节点条件不匹配时，终端重复将标准节点类型与下一个原模型节点类型进行比对。当标准节点条件与原模型节点条件匹配时，终端确定标准节点与原模型节点相匹配，可以将原模型节点记作与标准节点相匹配的待优化节点。

在本实施例中，终端根据标准节点对应的标准节点信息，以及原模型节点对应的原模型节点信息，将标准节点与原模型节点进行匹配，从原模型节点序列中遍历出与标准节点信息相匹配的原模型节点作为待优化节点，有效的提高了筛选待优化节点的准确性，准确的遍历出待优化子网络进行优化，有效的提高了对神经网络模型优化的准确性。

在其中一个实施例中，如图4所示，基于标准子网络所对应的目标子网络将待优化子网络进行优化，得到优化后的神经网络模型的步骤包括：

步骤402，获取原模型节点对应的原输入节点。

步骤404，将原输入节点与待优化子网络进行比对。

步骤406，当原输入节点属于待优化子网络时，确定原输入节点对应的原模型节点作为输出节点。

步骤408，剔除待优化子网络，将目标子网络与输出节点连接，得到优化后的神经网络模型。

终端可以根据原模型节点之间的关联关系，从原模型网络中获取每个原模型节点所对应的原输入节点。原输入节点是指所输出的数据作为原模型节点的输入数据的原模型节点，每个原模型节点本身可以作为其他原模型节点的原输入节点。每个原模型节点可以对应包括至少一个原输入节点。终端可以将多个原输入节点分别与待优化子网络中的多个待优化节点进行比对。当原输入节点不属于待优化子网络时，继续将下一个原输入节点与待优化子网络进行比对。当原输入节点属于待优化子网络时，终端可以确定属于待优化子网络的原输入节点所对应的原模型节点作为待优化子网络的输出节点。在其中一个实施例中，终端在遍历待优化节点时，可以根据原模型节点的原输入节点确定待优化子网络所对应的输入节点。

终端可以将待优化子网络替换为目标子网络，实现对神经网络模型的优化。具体的，终端可以从原模型网络中剔除待优化子网络，将待优化子网络替换为目标子网络。终端可以目标子网络分别与待优化子网络所对应的输入节点和输出节点相连接，得到优化后的神经网络模型。

在本实施例中，终端可以获取待优化子网络的输出节点，将待优化子网络替换为目标子网络。终端将目标子网络与输出节点连接，保证了替换待优化子网络的准确性，有效的提高了优化神经网络模型的准确性。

在其中一个实施例中，在解析模型标识对应的神经网络模型之前，上述神经网络模型的推理方法还包括：获取历史推理数据，历史推理数据包括历史优化模型标识；将模型标识与历史优化模型标识进行比对；当模型标识属于历史优化模型标识时，调用与历史优化模型标识相对应的历史优化神经网络模型。

终端在获取到模型推理任务，解析得到模型推理任务携带的模型标识后，可以获取历史推理数据。历史推理数据是指终端在历史时间内推理神经网络模型所对应的数据，历史时间是指终端获取到模型推理任务之间的历史时间段。历史推理数据具体可以包括历史优化模型标识，历史优化模型标识是指终端在历史时间内进行神经网络模型推理时，根据上述实施例中神经网络模型的推理方法进行优化后神经网络模型所对应的模型标识。

终端可以将模型标识与历史优化模型标识进行比对，判断模型标识是否与历史优化模型标识中的任意一个相同。若是，则确定模型标识属于历史优化模型标识。否则不属于历史优化模型标识。当模型标识不属于历史优化模型标识时，终端可以按照上述实施例中神经网络模型的推理方法对模型标识所对应的神经网络模型进行推理。当模型标识属于历史优化模型标识时，终端可以调用与历史优化模型标识相对应的历史优化神经网络模型，根据历史优化神经网络模型进行推理，得到模型推理结果。

在本实施例中，终端可以获取历史推理数据，将模型标识与历史推理数据中的历史优化模型标识进行比对。当模型标识属于历史优化模型标识时，终端可以调用对应历史优化模型标识所对应的历史优化神经网络模型进行推理，不需要每次都对神经网络模型进行优化，有效的节省了终端的运算资源。

应该理解的是，虽然图2和图4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2和图4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在其中一个实施例中，如图5所示，提供了一种神经网络模型的推理装置，包括：任务获取模块502、模型解析模块504、模型遍历模块506、模型优化模块508和模型推理模块510，其中：

任务获取模块502，用于获取模型推理任务，模型推理任务携带模型标识。

模型解析模块504，用于解析模型标识对应的神经网络模型，得到神经网络模型对应的原模型网络。

模型遍历模块506，用于获取预设的与模型标识对应的标准子网络；根据标准子网络对原模型网络进行遍历，得到待优化子网络。

模型优化模块508，用于基于标准子网络所对应的目标子网络将待优化子网络进行优化，得到优化后的神经网络模型。

模型推理模块510，用于根据优化后的神经网络模型进行推理，得到模型推理结果。

在其中一个实施例中，上述神经网络模型的推理装置还包括子网络生成模块，用于获取标准节点关联文件；根据标准节点关联文件生成网络描述脚本；执行网络描述脚本，生成标准子网络。

在其中一个实施例中，上述模型遍历模块506还用于将标准子网络和原模型网络分别进行拓扑排序，得到标准节点序列和原模型节点序列；根据标准节点序列与原模型节点序列中的原模型节点进行匹配，得到待优化节点；根据待优化节点生成待优化子网络。

在其中一个实施例中，上述模型遍历模块506还用于根据标准节点序列获取标准节点对应的标准节点信息；基于标准节点信息依次对原模型节点序列中的原模型节点进行遍历，确定与标准节点信息匹配的原模型节点作为待优化节点。

在其中一个实施例中，上述模型遍历模块506还用于当原模型节点序列中不存在与标准节点相匹配的原模型节点时，生成优化失败提示信息。

在其中一个实施例中，上述模型优化模块508还用于获取原模型节点对应的原输入节点；将原输入节点与待优化子网络进行比对；当原输入节点属于待优化子网络时，确定原输入节点对应的原模型节点作为输出节点；剔除待优化子网络，将目标子网络与输出节点连接，得到优化后的神经网络模型。

在其中一个实施例中，上述神经网络模型的推理装置还包括模型识别模块，用于获取历史推理数据，历史推理数据包括历史优化模型标识；将模型标识与历史优化模型标识进行比对；当模型标识属于历史优化模型标识时，调用与历史优化模型标识相对应的历史优化神经网络模型。

关于神经网络模型的推理装置的具体限定可以参见上文中对于神经网络模型的推理方法的限定，在此不再赘述。上述神经网络模型的推理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储神经网络模型的推理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种神经网络模型的推理方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

一种计算机设备，包括存储器和一个或多个处理器，存储器中储存有计算机可读指令，计算机可读指令被处理器执行时，使得一个或多个处理器执行时实现上述方法实施例中的步骤。

一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行时实现上述方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种神经网络模型的推理方法，包括：

获取模型推理任务，所述模型推理任务携带模型标识；

解析所述模型标识对应的神经网络模型，得到所述神经网络模型对应的原模型网络；

获取预设的与所述模型标识对应的标准子网络；

根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络；

基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型；及

根据所述优化后的神经网络模型进行推理，得到模型推理结果。
根据权利要求1所述的方法，其特征在于，在所述获取预设的与所述模型标识对应的标准子网络之前，所述方法还包括：

获取标准节点关联文件；

根据所述标准节点关联文件生成网络描述脚本；及

执行所述网络描述脚本，生成所述标准子网络。
根据权利要求1所述的方法，其特征在于，所述根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络，包括：

将所述标准子网络和所述原模型网络分别进行拓扑排序，得到标准节点序列和原模型节点序列；

根据所述标准节点序列与所述原模型节点序列中的原模型节点进行匹配，得到待优化节点；及

根据所述待优化节点生成待优化子网络。
根据权利要求3所述的方法，其特征在于，所述根据所述标准节点序列与所述原模型节点序列中的原模型节点进行匹配，得到待优化节点，包括：

根据所述标准节点序列获取标准节点对应的标准节点信息；及

基于所述标准节点信息依次对所述原模型节点序列中的原模型节点进行遍历，确定与所述标准节点信息匹配的原模型节点作为待优化节点。
根据权利要求3所述的方法，其特征在于，在所述根据所述标准节点序列与所述原模型节点序列中的原模型节点进行匹配之后，所述方法还包括：

当所述原模型节点序列中不存在与标准节点相匹配的原模型节点时，生成优化失败提示信息。
根据权利要求1所述的方法，其特征在于，所述基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型，包括：

获取原模型节点对应的原输入节点；

将所述原输入节点与所述待优化子网络进行比对；

当所述原输入节点属于所述待优化子网络时，确定所述原输入节点对应的所述原模型节点作为输出节点；及

剔除所述待优化子网络，将所述目标子网络与所述输出节点连接，得到优化后的神经网络模型。
根据权利要求1至6任一项所述的方法，其特征在于，在所述解析所述模型标识对应的神经网络模型之前，所述方法还包括：

获取历史推理数据，所述历史推理数据包括历史优化模型标识；

将所述模型标识与所述历史优化模型标识进行比对；及

当所述模型标识属于所述历史优化模型标识时，调用与所述历史优化模型标识相对应的历史优化神经网络模型。
一种神经网络模型的推理装置，包括：

任务获取模块，用于获取模型推理任务，所述模型推理任务携带模型标识；

模型解析模块，用于解析所述模型标识对应的神经网络模型，得到所述神经网络模型对应的原模型网络；

模型遍历模块，用于获取预设的与所述模型标识对应的标准子网络；根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络；

模型优化模块，用于基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型；及

模型推理模块，用于根据所述优化后的神经网络模型进行推理，得到模型推理结果。
根据权利要求8所述的装置，其特征在于，所模型遍历模块还用于将所述标准子网络和所述原模型网络分别进行拓扑排序，得到标准节点序列和原模型节点序列；根据所述标准节点序列与所述原模型节点序列中的原模型节点进行匹配，得到待优化节点；及根据所述待优化节点生成待优化子网络。
一种计算机设备，包括存储器及一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取模型推理任务，所述模型推理任务携带模型标识；

解析所述模型标识对应的神经网络模型，得到所述神经网络模型对应的原模型网络；

获取预设的与所述模型标识对应的标准子网络；

根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络；

基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型；及

根据所述优化后的神经网络模型进行推理，得到模型推理结果。
根据权利要求10所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取标准节点关联文件；

根据所述标准节点关联文件生成网络描述脚本；及

执行所述网络描述脚本，生成所述标准子网络。
根据权利要求10所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

将所述标准子网络和所述原模型网络分别进行拓扑排序，得到标准节点序列和原模型节点序列；

根据所述标准节点序列与所述原模型节点序列中的原模型节点进行匹配，得到待优化节点；及

根据所述待优化节点生成待优化子网络。
根据权利要求12所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

根据所述标准节点序列获取标准节点对应的标准节点信息；及

基于所述标准节点信息依次对所述原模型节点序列中的原模型节点进行遍历，确定与所述标准节点信息匹配的原模型节点作为待优化节点。
根据权利要求10所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取原模型节点对应的原输入节点；

将所述原输入节点与所述待优化子网络进行比对；

当所述原输入节点属于所述待优化子网络时，确定所述原输入节点对应的所述原模型节点作为输出节点；及

剔除所述待优化子网络，将所述目标子网络与所述输出节点连接，得到优化后的神经网络模型。
根据权利要求10至14任一项所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取历史推理数据，所述历史推理数据包括历史优化模型标识；

将所述模型标识与所述历史优化模型标识进行比对；及

当所述模型标识属于所述历史优化模型标识时，调用与所述历史优化模型标识相对应的历史优化神经网络模型。
一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取模型推理任务，所述模型推理任务携带模型标识；

解析所述模型标识对应的神经网络模型，得到所述神经网络模型对应的原模型网络；

获取预设的与所述模型标识对应的标准子网络；

根据所述标准子网络对所述原模型网络进行遍历，得到待优化子网络；

基于所述标准子网络所对应的目标子网络将所述待优化子网络进行优化，得到优化后的神经网络模型；及

根据所述优化后的神经网络模型进行推理，得到模型推理结果。
根据权利要求16所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

获取标准节点关联文件；

根据所述标准节点关联文件生成网络描述脚本；及

执行所述网络描述脚本，生成所述标准子网络。
根据权利要求16所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

将所述标准子网络和所述原模型网络分别进行拓扑排序，得到标准节点序列和原模型节点序列；

根据所述标准节点序列与所述原模型节点序列中的原模型节点进行匹配，得到待优化节点；及

根据所述待优化节点生成待优化子网络。
根据权利要求18所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

根据所述标准节点序列获取标准节点对应的标准节点信息；及

基于所述标准节点信息依次对所述原模型节点序列中的原模型节点进行遍历，确定与所述标准节点信息匹配的原模型节点作为待优化节点。
根据权利要求16所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

获取原模型节点对应的原输入节点；

将所述原输入节点与所述待优化子网络进行比对；

当所述原输入节点属于所述待优化子网络时，确定所述原输入节点对应的所述原模型节点作为输出节点；及

剔除所述待优化子网络，将所述目标子网络与所述输出节点连接，得到优化后的神经网络模型。