WO2020037475A1

WO2020037475A1 - 一种调试应用程序的方法及设备

Info

Publication number: WO2020037475A1
Application number: PCT/CN2018/101399
Authority: WO
Inventors: 朱伟; 雷亮; 谢淼
Original assignee: 华为技术有限公司
Priority date: 2018-08-20
Filing date: 2018-08-20
Publication date: 2020-02-27
Also published as: CN111316227A; CN111316227B

Abstract

一种调试应用程序的方法及设备，包括：PC确定对在线模型中的各个神经网络算子的支持状态；所述PC根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分；所述PC将所述神经网络部分转换为离线模型；所述PC将所述离线模型、所述神经网络算子部分对应的二进制程序算子信息打包到应用程序的程序包中，生成具有人工智能能力的应用程序包，以使得所述PC的安卓模拟器运行所述应用程序包时，调用所述PC的人工智能引擎框架和硬件加速设备对所述离线模型进行加速运算，并执行所述二进制程序算子信息对应的二进制程序算子。该方法用以提高对具有人工智能能力的应用程序的开发效率。

Description

一种调试应用程序的方法及设备

技术领域

本申请涉及通信技术领域，尤其涉及一种调试应用程序的方法及设备。

背景技术

随着智能终端的发展，越来越多的公司和个人投入到终端设备的程序开发上来，目前一般利用个人计算机(Personal Computer，PC)的集成开发环境(Integrated Development Environment，IDE)进行开发，当开发完成后再将开发生成的程序包下载到终端设备(例如手机)上运行。

由于软件开发的复杂性，开发人员在程序开发过程中往往需要反复对程序进行调试来修复程序问题和验证运行效果。在对终端设备进行软件开发时，由于IDE所在PC的操作系统和终端设备的操作系统不同，目前一般采用两种方式来进行调试。方式一：调试时将程序包从PC导入到终端设备中，然后使用PC上的开发工具与终端设备建立连接，并通过PC上的开发工具进行跟踪调试；方式二：使用PC上的IDE带的模拟器，直接在PC上运行和调试程序。

由于方式二直接在PC上进行调试，所有操作都在PC上完成，调试效率比较高，另外该方式不需要利用终端设备，所以硬件开销比较小。一般而言，开发人员会首先使用方式二进行前期调试，再将最终调试时生成的程序包从PC导入到终端设备中，使用终端设备进行真机测试，这样可以提高开发效率。以Android(安卓)终端程序开发为例，开发人员一般用PC上的Android Studio作为IDE来开发程序，并完成前期调试，最终才将程序包导入到安卓手机上进行真机测试。

但是，随着人工智能(Artificial Intelligence，AI)技术的发展，越来越多的Android应用程序具有AI能力，终端设备需要具有较强的运算能力才能对具有AI能力的应用程序进行神经网络模型运算，一般地，终端设备利用GPU或NPU等硬件加速设备对神经网络模型进行运算。由于具有硬件加速的AI能力的应用程序无法在PC上的IDE的模拟器中运行，所以当开发人员开发具有AI功能的应用程序时，不得不采用方式一进行调试，导致开发效率很低。

发明内容

本申请提供一种调试应用程序的方法及设备，用以提高对应用程序的开发效率。

第一方面，本申请实施例提供了一种调试应用程序的方法，该方法应用于PC上，该方法包括：所述PC确定自身的人工智能引擎框架和终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态，所述在线模型是所述应用程序具有的人工智能能力对应的数学模型；所述PC根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分，所述神经网络部分包括所述PC和所述终端设备都支持的神经网络算子，所述神经网络算子部分是所述PC不支持的神经网络算子和所述终端设备不支持的神经网络算子；所述PC将所述神经网络部分转换为离线模型；所述PC将所述离线模型、所述神经网络算子部分对应的二进制程序算子信息打包到所述应用程序的程序包中，生成具有人工智能能力的应用程序包，以使得所述PC的安卓模拟器运行所述应用程序包时，调用所述PC的人工智能引擎框架和硬件加速设备对所述离线模型进行加速运算，并执行所述二进制程序算子信息对应的二进制程序算子。

因神经网络部分包括所述PC和所述终端设备都支持的神经网络算子，所述神经网络算子部分是所述PC不支持的神经网络算子和所述终端设备不支持的神经网络算子，所以在本申请实施例中，该离线模型中的神经网络算子均能够被终端设备支持，所以这样得到的运算加速效果能够实现与在终端设备上的运算加速效果相同，因此可以达到了通过PC上的IDE进行开发调试的目的。

在一种可能的设计中，所述安卓模拟器从所述安卓模拟器的CPU软件算子库中查询到所述二进制程序算子信息对应的二进制程序算子，然后安卓模拟器执行所述二进制程序算子。

在本申请实施例中，PC通过本地硬件加速设备对转换后的离线模型进行运算加速，因该离线模型中的神经网络算子均能够被终端设备支持，所以这样得到的运算加速效果能够实现与在终端设备上的运算加速效果相同。

在一种可能的设计中，若所述终端设备上的人工智能引擎框架所支持的计算精度低于所述PC上的人工智能引擎框架所支持的计算精度，则所述PC将所述离线模型的计算精度调整至与所述终端设备上的人工智能引擎框架所支持的计算精度一致。

在本申请实施例中，因该离线模型中的计算精度与终端设备一致，所以这样得到的运算加速效果能够实现与在终端设备上的运算加速效果相同。

第二方面，本申请实施例提供了一种调试应用程序的方法，该方法应用在PC上，该方法包括：PC确定终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态，然后PC根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分；PC将所述神经网络部分转换为离线模型；PC将所述离线模型和所述神经网络算子部分对应的二进制程序算子信息打包到所述应用程序的程序包中，并将所述程序包发送到所述终端设备。

在本申请实施例中，PC可以生成使用与不同终端设备信息对应的程序包，可以减少开发者为了适配不同终端设备手动拆分离线模型的工作量，同时提高了调试的效率。

第三方面，本申请实施例还提供了一种PC，包括执行第一方面或者第一方面的任意一种可能的设计的方法的模块/单元。这些模块/单元可以通过硬件实现，也可以通过硬件执行相应的软件实现。

第四方面，本申请实施例还提供了一种PC，包括执行第二方面或者第二方面的任意一种可能的设计的方法的模块/单元。这些模块/单元可以通过硬件实现，也可以通过硬件执行相应的软件实现。

第五方面，本申请实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质包括计算机程序，当计算机程序在PC上运行时，使得所述PC执行第一方面或上述第一方面的任意一种可能的设计的方法。

第六方面，本申请实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质包括计算机程序，当计算机程序在PC上运行时，使得所述PC执行第二方面或上述第二方面的任意一种可能的设计的方法。

第七方面，本申请实施例还提供一种计算机程序产品，当所述计算机程序产品在PC 上运行时，使得所述PC执行第一方面或上述第一方面的任意一种可能的设计的方法。

第八方面，本申请实施例还提供一种计算机程序产品，当所述计算机程序产品在PC上运行时，使得所述PC执行第二方面或上述第二方面的任意一种可能的设计的方法。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

图1为本申请实施例提供的一种离线模型生成方式示意图；

图2为本申请实施例提供的一种调试应用程序的方法流程示意图；

图3为本申请实施例提供的一种在线模型转换示意图；

图4为本申请实施例提供的一种PC的系统结构示意图；

图5为本申请实施例提供的一种调试应用程序的装置结构示意图；

图6为本申请实施例提供的调试应用程序的方法流程示意图；

图7为本申请实施例提供的一种调试应用程序的应用场景示意图；

图8为本申请实施例提供的另一种PC的系统结构示意图；

图9为本申请实施例提供的一种PC结构示意图。

具体实施方式

为了便于理解，示例的给出了部分与本申请实施例相关概念的说明以供参考。如下所示：

1、IDE是用于提供程序开发环境的应用程序，一般包括代码编辑器、编译器、调试器和图形用户界面等工具。IDE集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务套。例如，IDE可以是微软的Visual Studio系列。

2、AI是计算机科学的一个分支，用于了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

3、HiAI是面向移动终端的AI计算平台，人工智能引擎框架(HiAI Foundation)是HiAI中的芯片能力开放层，HiAI Foundation支持针对神经网络模型运算的专用AI指令集，可以用最少的时钟周期高效并行执行更多的神经网络算子。

4、在线模型是标准的神经网络模型(如Caffe等)，在线模型和终端设备信息是无关的。

5、离线模型是将在线模型编译生成的专用AI指令集，离线模型是和终端设备信息是相关的。

举例来说，如图1所示，PC通过编译工具将在线模型编译生成可以在HiAI Foundation上高效执行的离线模型，其中，该离线模型可以保存为二进制文件(例如Offline Model)。之所以将在线模型编译转换为离线模型，是为了能够在NPU上运行，提高运算速度。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。其中，在本申请实施例的描述中，除非另有说明，在本申请实施例的描述中，“多个”是指两个或多于两个。

以下，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。

目前，PC上IDE中的模拟器无法运行具有硬件加速的AI功能的应用程序，IDE也无法支持调试具有硬件加速的AI功能的应用程序。也就是说现有技术不支持开发人员通过IDE对具有硬件加速的AI功能的应用程序进行调试，所以开发人员不得不将程序包导入到终端设备后，通过终端设备进行调试，导致开发效率很低。为了解决这一问题，本申请实施例提供一种调试应用程序的方法，该方法可以由PC执行，本申请结合图2所示的方法流程图对本申请实施例提供的调试应用程序的方法的具体过程进行详细阐述，具体流程如下。

步骤201，PC确定自身的人工智能引擎框架和终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态。

其中，该在线模型是应用程序具有的人工智能能力对应的数学模型，该应用程序是可以在支持Android系统的终端设备运行的Android应用程序，也可以是能够在支持IOS系统的终端设备上运行的IOS应用程序。以下以Android应用程序为例进行说明。

具体地，不同的应用程序具有的人工智能能力所对应的在线模型可能不同，不同的在线模型中的神经网络算子是不同的，针对同一个在线模型，不同版本HiAI Foundation所支持的神经网络算子也可能不同。例如说，相册应用具有的图像分类能力所对应的在线模型一与相机应用具有的人脸识别能力所对应的在线模型二两者可能是不同的在线模型，在线模型一和在线模型二中的神经网络算子是不同的。

本申请实施例中，在执行步骤201之前，PC可以预先存储有不同版本的HiAI Foundation对各个在线模型的支持能力，例如针对具有图像分类功能的MobileNet模型，HiAI Foundation100版本不支持该MobileNet模型中的channelwise卷积算子和pointwise卷积算子，HiAI Foundation150版本支持该MobileNet模型中的所有神经网络算子。

一般地，PC可以获取自身的HiAI Foundation版本信息和终端设备上的HiAI Foundation版本信息，先根据终端设备的HiAI Foundation版本信息，确定出该版本的HiAI Foundation对在线模型的支持能力。若PC发现终端设备的HiAI Foundation版本不支持在线模型中的第一神经网络算子，则PC确定第一神经网络算子的支持状态为否。进一步地，PC根据自身的HiAI Foundation版本信息，确定出该版本的HiAI Foundation对在线模型的支持能力。若PC发现PC的HiAI Foundation版本不支持在线模型中的第二神经网络算子，则PC确定第二神经网络算子的支持状态为否。可以理解地，PC根据自身的HiAI Foundation版本信息，确定出该版本的HiAI Foundation对在线模型的支持能力时，可以是根据PC自身的HiAI Foundation对在线模型中除去第一神经网络算子以外的部分确定是否支持。

步骤202，PC根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分。

具体地，当PC确定出存在支持状态为否的神经网络算子时，PC从安卓模拟器的CPU的软件算子库中查询是否存在与所述支持状态为否的神经网络算子对应的二进制程序算子，若存在，则PC将在线模型转换拆分为两个部分，即神经网络算子部分和神经网络部分；其中，神经网络算子部分包括PC不支持的神经网络算子和终端设备不支持的神经网络算子；神经网络部分为在线模型中除了神经网络算子部分之外的神经网络部分，包括PC和所述终端设备都支持的神经网络算子。

举例来说，在线模型是具有图像分类功能的MobileNet模型，终端设备和PC所支持的HiAI Foundation版本信息均是HiAI V100。因MobileNet模型中使用了channelwise卷积算子和pointwise卷积算子，终端设备和PC所支持的HiAI Foundation并不支持这两个卷积算子。因此，PC将MobileNet模型拆分成如图3所示的五个部分：1)channelwise卷积算子之前的神经网络部分一；2)channelwise卷积算子；3)channelwise卷积算子与pointwise卷积算子之间的神经网络部分二；4)pointwise卷积算子；5)pointwise卷积算子之后的神经网络部分三。

步骤203，PC将所述神经网络部分转换为离线模型。

接续图3所示的示例，也就是说，PC将三个神经网络部分编译成离线模型，同时PC从安卓模拟器的CPU算子库中查找出channelwis卷积算子与pointwise卷积算子对应的两个二进制程序算子信息。这样，离线模型中的所有神经网络算子均能够被PC和终端设备的硬件加速设备所执行。

需要说明的是，如果安卓模拟器的CPU软件算子库中不存在与支持状态为否的神经网络算子对应的二进制程序算子信息，则PC停止执行下述步骤204，并向用户发送缺失算子信息的报告。安卓模拟器的CPU软件算子库与安卓模拟器模拟的终端设备的硬件CPU的软件算子库是等同的，该终端设备指的是用于运行PC所生成的应用程序包的设备。

步骤204，PC将所述离线模型、所述神经网络算子部分对应的二进制程序算子信息打包到所述应用程序的程序包中，生成具有人工智能能力的应用程序包。

步骤205，当所述PC的安卓模拟器运行所述应用程序包时，所述安卓模拟器调用所述PC的人工智能引擎框架和硬件加速设备对所述离线模型进行加速运算，并执行所述二进制程序算子信息对应的二进制程序算子。

其中，安卓模拟器能在电脑上模拟出安卓手机运行环境，可以理解地安卓模拟器可以模拟出安卓手机的硬件以及软件环境。安卓模拟器上能安装、使用、卸载安卓应用的软件，可以让用户在电脑上体验操作安卓系统。该运行环境中的CPU是一种软件模拟的CPU，该软件模拟的CPU是运行在PC上的硬件CPU上。例如，安卓模拟器可以模拟出华为P20的手机运行环境，或者华为Mate 10的手机运行环境。现有的安卓模拟器无法模拟出安卓手机的硬件加速能力，无法运行需要进行硬件加速的具有AI能力的应用程序。

例如，当所述PC的安卓模拟器运行应用程序包时，在图3中，当HiAI Foundation和NPU执行离线模型的神经网络部分一生成运算结果后，将该运算结果作为输入参数传递给安卓模拟器，由安卓模拟器执行channelwise卷积算子对应的二进制程序算子的运算，然后安卓模拟器将channelwise卷积算子对应的二进制程序算子运算生成的运算结果作为输入参数传递给HiAI Foundation和NPU，HiAI Foundation和NPU根据安卓模拟器传递的输入参数继续执行神经网络部分二的运算结果，然后将该运算结果作为输入参数传递给安卓模拟器，由安卓模拟器执行pointwise卷积算子对应的二进制程序算子的运算，然后安卓模拟器将pointwise卷积算子对应的二进制程序算子运算生成的运算结果作为输入参数传递给HiAI Foundation和NPU，HiAI Foundation和NPU根据该输入参数执行神经网络部分三的运算，生成运算结果，该运算结果返回给安卓模拟器。

另外，若终端设备的HiAI Foundation版本信息所支持的精度低于在线模型的精度，则PC将该在线模型的精度向下调整至该终端设备所支持的精度，反之，则不进行调整，例如终端设备的HiAI Foundation版本信息为HiAI V100，该版本能够支持的精度为float 16位，而在线模型所支持的精度为float32位，则将float32位向下调整至float16位。

进一步地，本申请实施例提供一种具有图4所示的系统架构的PC，该系统架构包括：IDE101、人工智能引擎框架(HiAI Foundation)102，及硬件加速设备103。

其中，IDE101中除了包括应用程序1010、在线模型1011、安卓模拟器1012，还包括一种调试应用程序的装置1013，该装置1013包括：状态确定单元1013a、模型转换单元1013b、应用程序包生成单元1013c、处理单元1013d。

具体地，例如应用程序1010可以是相册这一应用程序，在线模型1011可以是具有图像分类功能的MobileNet。

其中，状态确定单元1013a，用于确定PC自身的人工智能引擎框架和终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态。

其中，在线模型是所述应用程序具有的人工智能能力对应的数学模型。

模型转换单元1013b，用于根据所述支持状态，将在线模型拆分为神经网络部分和神经网络算子部分，并将所述神经网络部分转换为离线模型。其中，神经网络算子部分为支持状态为否的神经网络算子，即PC上的HiAI Foundation不支持的神经网络算子和终端设备的HiAI Foundation不支持的神经网络算子；神经网络部分为在线模型中除了神经网络算子部分之外的神经网络部分。

也就是说，如果在线模型1011中存在PC和终端设备上的人工智能引擎框架所不支持的神经网络算子时，模型转换单元1013b将在线模型1011拆分为神经网络部分和神经网络算子这两部分。然后模型转换单元1013b将神经网络部分转换为离线模型。另外，模型转换单元1013b从安卓模拟器的CPU的软件算子库中查询与神经网络算子部分对应的二进制程序算子信息。

需要说明的是，安卓模拟器的CPU软件算子库指的是安卓模拟器的CPU所能够支持的算子，可以理解地是，安卓模拟器所模拟的终端设备的CPU所能够支持的算子。一般该软件算子库中的算子是二进制程序形式，因此CPU的软件算子库中的算子亦称为二进制程序算子。

应用程序包生成单元1013c，用于将离线模型、二进制程序算子信息打包到应用程序的程序包中，生成具有人工智能能力的应用程序包。

另外，当应用程序包生成单元1013c生成了该应用程序包之后，安卓模拟器1012从应用程序包生成单元1013c中获取该应用程序包。

处理单元1013d，用于当所述安卓模拟器运行该应用程序包时，调用所述人工智能引擎框架和所述硬件加速设备，对所述应用程序包中的离线模型进行加速运算生成第一运算结果，以使所述安卓模拟器根据第一运算结果和所述二进制程序算子信息对应的二进制程序算子进行运算得到目标运算结果。

这样，当开发者在PC的IDE上对具有硬件加速的AI能力的应用程序进行开发和调试时，PC上的IDE可以将在线模型进行转换为与终端设备信息对应的离线模型和二进制程序算子，然后通过本地硬件加速设备对转换后的离线模型进行运算加速，因该离线模型中的神经网络算子均能够被终端设备支持，所以这样得到的运算加速效果能够实现与在终端设备上的运算加速效果相同，因此可以达到了通过PC上的IDE进行开发调试的目的。

在本申请实施例中，当应用程序包生成单元1013c生成了具有人工智能能力的应用程序包后，会将该应用程序包传递至安卓模拟器1012，当安卓模拟器1012运行该应用程序包时，因安卓模拟器1012的运行环境是安卓操作系统，PC的操作系统是window系统，所以安卓模拟器1012无法直接调用PC中的硬件加速设备对程序包中的离线模型进行加速，为了实现这一功能，故本申请实施例中，调试应用程序的装置1013的处理单元1013d包括仿真容器单元1013e、数据缓存单元1013f，如图5所示。

其中，安卓模拟器1012与仿真容器单元1013e建立传输控制协议(Transmission Control Protocol，TCP)连接，安卓模拟器1012通过仿真容器单元1013e向PC的HiAI Foundation发送运算离线模型的调用请求，该调用请求包括离线模型的信息和待处理的文件信息。

其中，离线模型的信息可以是离线模型对应的二进制文件，也可以是离线模型的保存的路径信息，待处理的文件信息可以指类似于图像文件或者声音文件等需要进行人工智能处理的原始数据。

仿真容器单元1013e接收到安卓模拟器的调用请求后，将调用请求中的待处理的文件信息的数据结构转换成Windows的格式的原始数据，并把Windows的格式的原始数据发送至HiAI Foundation102。

另外，仿真容器单元1013e还将所述调用请求中的应用程序包中的离线模型保存到数据缓存单元1013f中，并将该离线模型在数据缓存单元1013f中保存路径信息发送至HiAI Foundation102。

HiAI Foundation102从所述仿真容器单元1013e接收Windows的格式的原始数据和所述保存路径信息后，从所述保存路径信息获取所述离线模型。然后HiAI Foundation102调用NPU，利用所述离线模型对所述Windows的格式的原始数据进行加速运算，生成第一运算结果。

然后，仿真容器单元1013e从HiAI Foundation102获取第一运算结果，并将该第一运算结果发送至安卓模拟器1012。安卓模拟器1012执行二进制算子信息对应的二进制算子对所述第一运算结果进行运算，最终生成该原始数据的目标运算结果。可以理解地，安卓模拟器1012在运行应用程序包的过程中，可能会多次执行以下过程：安卓模拟器1012通过仿真容器单元1013e调用HiAI Foundation102和NPU以便得到下一步运算结果，并且仿真容器单元1013e将下一步运算结果发给安卓模拟器，安卓模拟器执行二进制程序算子对该下一步运算结果进行运算。

需要说明的是，仿真容器单元1013e首先将第一运算结果转换为安卓数据格式的第一运算结果，然后发送安卓模拟器1012。另外，仿真容器单元1013e可能在执行离线模型的运算时多次调用HiAI Foundation102，并将每次生成的运算结果发送至安卓模拟器1012。

这样，PC中的安卓模拟器就能够使用PC本地的硬件加速设备进行运算加速，同时运算效果能够与在终端设备上运算效果相同，另外，当需要跟踪定位问题时，开发者也可以在PC本地对应用程序跟踪调试，或者在PC本地查看运行过程中生成的相关日志来快速定位问题。

另外，PC完成应用程序的开发和调试后，会输出与终端设备信息对应的程序包，当终端设备导入这一程序包后，可以实现相应的AI功能。示例性的，该终端设备可以为能够进行硬件加速，操作系统为安卓操作系统的智能手机、平板电脑等移动终端设备。终端设备信息可以为终端设备的HiAI Foundation版本信息，终端设备的型号等。

本申请实施例还提供一种调试应用程序的方法，该方法主要应用场景是：当开发者在PC的IDE上进行应用程序的开发和调试时，PC上的IDE可以根据终端设备信息对在线模型进行转换，然后生成终端设备上可运行的离线模型。如图6所示，本申请实施例提供的调试应用程序的方法的具体过程进行详细阐述，具体流程如下。

步骤601，PC确定终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态。

同样的，PC可以预先存储有不同版本的HiAI Foundation对各个在线模型的支持能力，PC可以获取终端设备上的HiAI Foundation版本信息，根据终端设备的HiAI Foundation版本信息，查找确定出该版本的HiAI Foundation对在线模型的支持能力。若PC发现终端设备的HiAI Foundation版本不支持线模型中的第一神经网络算子，则PC确定第一神经网络算子的支持状态为否。

步骤602，PC根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分。神经网络算子部分为终端设备上的HiAI Foundation不支持的神经网络算子，如上所述第一神经网络算子，神经网络部分为在线模型中除神经网络算子部分以外的部分。

与上文类似，当PC确定出存在支持状态为否的神经网络算子时，PC获取终端设备的信息，根据终端设备的信息确定终端的CPU标识。PC从该CPU标识对应的软件算子库中查询是否存在与所述支持状态为否的神经网络算子对应的二进制程序算子，若存在，则PC将在线模型转换拆分为两个部分；其中，神经网络算子部分为该支持状态为否的神经网络算子；神经网络部分为在线模型中除了神经网络算子部分之外的神经网络部分。

步骤603，PC将所述神经网络部分转换为离线模型。

步骤604，PC将所述离线模型和所述神经网络算子部分对应的二进制程序算子信息打包到应用程序的程序包中，并将所述程序包发送到所述终端设备。

这样，PC就可以输出与终端设备信息对应的程序包，当终端安装了这一程序包后，可以运行该具有AI能力的应用程序。

进一步地，本申请结合图7所示场景，对本申请实施例提供的调试应用程序的方法的具体过程进行举例说明，具体流程如下。

步骤a，PC获取终端设备一的HiAI Foundation的第一版本信息是HiAI V100和终端设备二的HiAI Foundation的第二版本信息是HiAI V150。

步骤b，PC根据HiAI V100，确定HiAI V100对应的HiAI Foundation不支持MobileNet模型中的channelwise卷积算子和pointwise卷积算子。PC将MobileNet模型中除了这两个卷积算子以外的部分转换为第一离线模型，其中，该第一离线模型中的神经网络算子能够被该终端设备一的硬件加速设备运行。PC根据终端设备的信息，确定终端设备的CPU的软件算子库，从该CPU软件算子库中查询到与channelwise卷积算子和pointwise卷积算子对应的二进制程序算子信息。

另外，PC根据HiAI V150，确定HiAI V150对应的HiAI Foundation支持MobileNet模型中的所有神经网络算子。因此，PC将MobileNet模型直接编译转换为第二离线模型。其中，该第二离线模型中的神经网络算子能够被该终端设备二的硬件加速设备运行。

步骤c，PC将第一离线模型、二进制程序算子信息打包到应用程序(例如相册应用)的程序包一中，并将程序包一发送至终端设备一，另外，PC将第二离线模型打包到应用程序(例如相册应用)的程序包二中，并将程序包二发送至终端设备二。

步骤d，终端设备一安装运行程序包一，调用NPU执行该离线模型一，且终端设备一根据二进制程序算子信息从终端设备的CPU的二进制程序算子库中查找与二进制程序算子信息对应的二进制程序算子，并由CPU来执行这两个二进制程序算子。终端设备二安装运行程序包二，调用NPU执行该离线模型二。

示例性的，上述终端设备可以为具有硬件加速设备，操作系统为安卓操作系统的智能手机、平板电脑等移动终端设备。

进一步地，该方法可以应用于具有图8所示的系统架构的PC，图8中的系统架构包括IDE101。

其中，IDE101中仅包括应用程序1010、在线模型1011，还包括一种调试应用程序的装置1013，该装置1013包括：状态确定单元1013a、模型转换单元1013b、应用程序包生成单元1013c、发送单元1013g。

具体地，状态确定单元1013a，用于确定终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态。

模型转换单元1013b，用于根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分，并将神经网络部分转换成离线模型。

应用程序包生成单元1013c，用于将离线模型、所述神经网络算子部分对应的二进制程序算子信息打包到应用程序的程序包中，生成具有人工智能能力的应用程序包。

发送单元1013g，用于将所述应用程序包发送至所述终端设备。

其中，部分单元的具体实现可以参加图4中的各个单元的具体实现，此处不再赘述。

基于以上实施例，本申请实施例还提供了一种PC，其中，该PC具有硬件加速设备(例如GPU和NPU)和CPU，且具有windows操作系统。该PC用于实现图2或6所述的实施例描述的方法，参阅如图9所示，该PC包括处理器901、存储器902以及收发器903。其中该一个或多个计算机程序被存储在上述存储器902中并被配置为被该一个或多个处理器901执行。

处理器901，可以是中央处理单元(central processing unit，CPU)，或者为数字处理单元、GPU、NPU等等，处理器901是PC900的控制中心，利用各种接口和线路连接整个PC的各个部分，通过运行或执行存储在存储器902内的计算机程序，以及调用存储在存储器902内的数据，执行PC900的各种功能和数据处理。

存储器902，用于存储待运行的计算机程序，应用程序的代码、在线模型、离线模型等。

收发器903，用于将处理器901生成的应用程序包发送至终端侧。

本申请实施例中不限定上述处理器901以及存储器902之间的具体连接介质。本申请实施例在图9中以存储器902、处理器901以及收发器903之间通过总线904连接，总线在图9中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

其中，存储器902可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)；存储器902也可以是非易失性存储器(non-volatile memory)，例如只读存储器，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)、或者存储器902是能够用于携带或存储具有指令或数据结构形式的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器902可以是上述存储器的组合。

当存储器902存储的一个或多个计算机程序被所述处理器901执行时，使得PC900执行如图2或者图6相应实施例中的各个步骤，具体过程可以参加上述实施例，该处不再赘述。

基于以上实施例，本申请实施例还提供了一种PC，其中，该PC具有硬件加速设备(例如GPU和NPU)和CPU，且具有windows操作系统。参阅如图9所示，该PC包括处理器901、存储器902以及收发器903。其中该一个或多个计算机程序被存储在上述存储器902中并被配置为被该一个或多个处理器901执行以实现图4或图8中的调试应用程序的装置的功能。

本申请实施例还提供了一种计算机可读存储介质，存储为执行上述处理器所需执行的计算机软件指令，其包含用于执行上述处理器所需执行的程序。

本申请实施例还提供了一种计算机程序产品，当所述计算机程序产品被计算机执行时，使所述计算机执如上述调试应用程序的方法。

本申请实施例还提供了一种计算机可读存储介质，存储为执行上述处理器所需执行的计算机软件指令，其包含用于实现调试应用程序的装置的功能的程序。

本申请实施例还提供了一种计算机程序产品，当所述计算机程序产品被计算机执行时，使所述计算机实现调试应用程序的装置的功能。

综上所述，在本申请一个实施例中，当开发者在PC的IDE上进行应用程序的开发和调试时，主要是通过PC上的IDE可以对在线模型进行转换得到转换后的离线模型，然后通过本地硬件加速设备对转换后的离线模型进行运算加速，因离线模型中的神经网络算子均能够被终端设备支持，所以这样得到的运算加速效果能够实现与在终端设备上的运算加速效果相同，因此可以达到了通过PC上的IDE进行开发调试的目的。在本申请另一个实施例中，PC可以生成使用与不同终端设备信息对应的程序包，可以减少开发者为了适配不同终端设备手动拆分离线模型的工作量，同时提高了调试的效率。

本所属领域的技术人员可以清楚地了解到，本发明提供的各实施例的描述可以相互参照，为描述的方便和简洁，关于本申请实施例提供的各装置、设备的功能以及执行的步骤可以参照本发明方法实施例的相关描述，在此不做赘述。

本领域技术人员还可以了解到本申请实施例列出的各种说明性逻辑块(illustrative logical block)和步骤(step)可以通过电子硬件、电脑软件，或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability)，上述的各种说明性部件(illustrative components)和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本申请实施例保护的范围。

本申请实施例中所描述的各种说明性的逻辑块，模块和电路可以通过通用处理单元，数字信号处理单元，专用集成电路(ASIC)，现场可编程门阵列(FPGA)或其它可编程逻辑装置，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理单元可以为微处理单元，可选地，该通用处理单元也可以为任何传统的处理单元、控制器、微控制器或状态机。处理单元也可以通过计算装置的组合来实现，例如数字信号处理单元和微处理单元，多个微处理单元，一个或多个微处理单元联合一个数字信号处理单元核，或任何其它类似的配置来实现。

本申请实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理单元执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理单元连接，以使得处理单元可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理单元中。处理单元和存储媒介可以配置于ASIC中，ASIC可以配置于用户终端中。可选地，处理单元和存储媒介也可以配置于用户终端中的不同的部件中。

在一个或多个示例性的设计中，本申请实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现，这些功能可以存储与电脑可读的媒介上，或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如，这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置，或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理单元读取形式的程序代码的媒介。此外，任何连接都可以被适当地定义为电脑可读媒介，例如，如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电脑、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘，磁盘通常以磁性复制数据，而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

本申请的上述描述可以使得本领域技术任何可以利用或实现本申请的内容，任何基于所公开内容的修改都应该被认为是本领域显而易见的，本申请所描述的基本原则可以应用到其它变形中而不偏离本申请的发明本质和范围。因此，本申请所公开的内容不仅仅局限于所描述的实施例和设计，还可以扩展到与本申请原则和所公开的新特征一致的最大范围。

Claims

一种调试应用程序的方法，该方法应用在个人电脑PC上，其特征在于，所述方法包括：

所述PC确定自身的人工智能引擎框架和终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态，所述在线模型是应用程序具有的人工智能能力对应的数学模型；

所述PC根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分，所述神经网络部分包括所述PC和所述终端设备都支持的神经网络算子，所述神经网络算子部分是所述PC不支持的神经网络算子和所述终端设备不支持的神经网络算子；

所述PC将所述神经网络部分转换为离线模型；

所述PC将所述离线模型、所述神经网络算子部分对应的二进制程序算子信息打包到所述应用程序的程序包中，生成具有人工智能能力的应用程序包，以使得所述PC的安卓模拟器运行所述应用程序包时，所述安卓模拟器调用所述PC的人工智能引擎框架和硬件加速设备对所述离线模型进行加速运算，并执行所述二进制程序算子信息对应的二进制程序算子。
如权利要求1所述的方法，其特征在于，所述执行所述二进制程序算子信息对应的二进制程序算子，包括：

所述安卓模拟器从所述安卓模拟器的CPU软件算子库中查询到所述二进制程序算子信息对应的二进制程序算子；

所述安卓模拟器执行所述二进制程序算子。
如权利要求2所述的方法，其特征在于，所述PC将所述神经网络部分转换为离线模型之后，还包括：

若所述终端设备上的人工智能引擎框架所支持的计算精度低于所述PC上的人工智能引擎框架所支持的计算精度，则所述PC将所述离线模型的计算精度调整至与所述终端设备上的人工智能引擎框架所支持的计算精度一致。
一种调试应用程序的方法，该方法应用在个人电脑PC上，其特征在于，包括：

所述PC确定终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态，所述在线模型是所述应用程序具有的人工智能能力对应的数学模型；

所述PC根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分，所述神经网络部分包括所述终端设备都支持的神经网络算子，所述神经网络算子部分是所述终端设备不支持的神经网络算子；

所述PC将所述神经网络部分转换为离线模型；

所述PC将所述离线模型和所述神经网络部分对应的二进制程序算子信息打包到所述应用程序的程序包中，并将所述程序包发送到所述终端设备。
一种调试应用程序的装置，所述装置设置于个人电脑PC中，所述PC包括安卓模拟器、人工智能引擎框架、硬件加速设备和中央处理器CPU，其特征在于，包括：

状态确定单元，用于确定所述PC的人工智能引擎框架和终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态，所述在线模型是所述应用程序具有的人工智能能力对应的数学模型；

模型转换单元，用于根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分，并将所述神经网络部分转换为离线模型；所述神经网络部分包括所述PC和所述终端设备都支持的神经网络算子，所述神经网络算子部分是所述PC不支持的神经网络算子和所述终端设备不支持的神经网络算子；

应用程序包生成单元，用于将所述离线模型、所述神经网络算子部分对应的二进制程序算子信息打包到所述应用程序的程序包中，生成具有人工智能能力的应用程序包；

处理单元，用于当所述安卓模拟器从所述应用程序包生成单元获取所述应用程序包并运行所述应用程序包时，根据所述安卓模拟器的调用请求来调用所述PC的所述人工智能引擎框架和所述硬件加速设备对所述应用程序包中的离线模型进行加速运算，生成第一运算结果，以使所述安卓模拟器根据所述第一运算结果和所述二进制程序算子信息对应的二进制程序算子得到目标运算结果。
如权利要求5所述的装置，其特征在于，所述处理单元包括仿真容器单元和数据缓存单元；

所述仿真容器单元，用于接收在所述安卓模拟器运行所述应用程序包时发送的所述调用请求，并将所述调用请求中的待处理的文件信息的格式转换为Windows的格式的原始数据；

所述仿真容器单元，还用于从所述应用程序包生成单元获取所述离线模型，并保存至所述数据缓存单元；

所述仿真容器单元，还用于将所述Windows的格式的原始数据和所述离线模型在所述数据缓存单元中的保存路径信息发送至所述人工智能引擎框架；

所述仿真容器单元，还用于获取所述人工智能引擎框架和硬件加速设备利用所述离线模型对所述Windows的格式的原始数据进行运算生成的第一运算结果，并将所述第一运算结果发送至所述安卓模拟器。
一种调试应用程序的装置，其特征在于，包括：

状态确定单元，用于确定终端设备上的人工智能引擎框架对在线模型中的各个神经网络算子的支持状态，所述在线模型是所述应用程序具有的人工智能能力对应的数学模型，所述终端设备用于运行所述应用程序；

模型转换单元，用于根据所述支持状态，将所述在线模型拆分为神经网络部分和神经网络算子部分，并将所述神经网络部分转换为离线模型；所述神经网络部分包括所述终端设备支持的神经网络算子，所述神经网络算子部分是所述终端设备不支持的神经网络算子；

应用程序包生成单元，用于将所述离线模型、所述神经网络算子部分对应的二进制程序算子信息打包到所述应用程序的程序包中，生成具有人工智能能力的应用程序包；

发送单元，用于将所述应用程序包发送至所述终端设备。
一种个人电脑PC，其特征在于，包括一个或多个处理器和一个或多个存储器；

所述一个或多个存储器与所述一个或多个处理器耦合，所述一个或多个存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，当所述一个或多个处理器执行所述计算机指令时，所述PC执行如权利要求1至7任一项所述的方法。
一种计算机存储介质，其特征在于，所述计算机可读存储介质包括计算机程序，当计算机程序在PC上运行时，使得所述PC执行如权利要求1至7任一所述的方法。