CN107958285A - 面向嵌入式系统的神经网络的映射方法及装置 - Google Patents

面向嵌入式系统的神经网络的映射方法及装置 Download PDF

Info

Publication number
CN107958285A
CN107958285A CN201711162662.9A CN201711162662A CN107958285A CN 107958285 A CN107958285 A CN 107958285A CN 201711162662 A CN201711162662 A CN 201711162662A CN 107958285 A CN107958285 A CN 107958285A
Authority
CN
China
Prior art keywords
neutral net
deep learning
data flow
flow diagram
computing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711162662.9A
Other languages
English (en)
Inventor
俞波
刘少山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Pusi Yingcha Technology Co Ltd
Original Assignee
Shenzhen Pusi Yingcha Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Pusi Yingcha Technology Co Ltd filed Critical Shenzhen Pusi Yingcha Technology Co Ltd
Priority to CN201711162662.9A priority Critical patent/CN107958285A/zh
Publication of CN107958285A publication Critical patent/CN107958285A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

一种面向嵌入式系统的神经网络的映射方法及装置,方法包括:建立所述神经网络结构,并获取所述神经网络的参数;根据所述神经网络结构和所述神经网络的参数生成描述所述神经网络的数据流图;获取深度学习计算单元库,并利用深度学习计算单元库实现神经网络的数据流图,以获取神经网络的实现程序,从而能够以深度学习计算单元库为基础,将神经网络映射为应用于嵌入式系统的实现程序,从而能够加快神经网络在嵌入式平台的实现速度,最大化嵌入式平台的性能。

Description

面向嵌入式系统的神经网络的映射方法及装置
技术领域
本发明涉及机器学习技术领域,具体涉及一种面向嵌入式系统的神经网络的映射方法、一种面向嵌入式系统的神经网络系统以及一种面向嵌入式系统的神经网络的映射装置。
背景技术
近几年,深度学习算法被成功应用于图片搜索和语言识别等领域。由于计算量大、内存占用高和应用实时性的要求,深度学习算法往往被部署在云端。随着芯片工艺和架构技术进步,以及轻量级深度学习模型的问世,深度学习算法已经可以在智能手机和嵌入式设备中实现,并将成为智能机器人、无人机和无人车等新型人工智能应用的基本功能单元。
相关技术中,为了在嵌入式设备实现深度学习算法,通常将开源的深度学习框架例如TensorFlow(谷歌的第二代分布式机器学习系统)、Caffe(ConvolutionalArchitecture for Fast Feature Embedding,卷积神经网络框架)或MXNet,移植到嵌入式计算平台。其中,开源深度学习框架指定移植支持的硬件架构、操作系统、工具链和基础软件库,提供移植所需的样例流程。开发者首先检查嵌入式平台是否满足移植的条件,然后以样例流程为模版,根据实际的平台修改流程,移植这些开源框架。
但是,相关技术存在的问题是,开源框架大多针对云端平台,很难高效地应用到嵌入式平台,造成人力和时间的大量消耗,甚至影响产品原型验证和上市时间。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一方面的在于提出一种面向嵌入式系统的神经网络的映射方法,能够将神经网络映射成适用于嵌入式系统的实现程序。
根据第一方面,实施例中提供一种面向嵌入式系统的神经网络的映射方法,包括以下步骤:
建立所述神经网络结构,并获取所述神经网络的参数;
根据所述神经网络结构和所述神经网络的参数生成描述所述神经网络的数据流图;
获取深度学习计算单元库,并利用深度学习计算单元库实现神经网络的数据流图,以获取神经网络的实现程序。
可选的,所述神经网络的参数可通过神经网络的深度学习模型训练获取。
可选的,所述数据流图的具有节点和边,所述方法可还包括:将所述数据流图的节点映射到所述深度学习计算单元库,所述数据流图的边映射为所述节点的逻辑关系,以通过所述深度学习单元库获取神经网络的实现程序。
可选的,所述深度学习计算单元库可为适用于嵌入式系统的单元库。
根据第二方面,一种实施例中提供面向嵌入式系统的神经网络系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现所述的方法。
根据第三方面,一种实施例中提供计算机可读存储介质所述程序能够被处理器执行以实现所述的方法。
根据第四方面,一种实施例中提供面向嵌入式系统的神经网络的映射装置包括:
第一获取单元,用于获取所述神经网络结构和所述神经网络的参数;
编译器,用于根据所述神经网络结构和所述神经网络的参数生成描述所述神经网络的数据流图;
第二获取单元,用于获取深度学习计算单元库,并利用深度学习计算单元库实现神经网络的数据流图,以获取神经网络的实现程序。
可选的,所述神经网络的参数可通过神经网络的深度学习模型训练获取。
可选的,所述数据流图的具有节点和边,所述装置可还包括:将所述数据流图的节点映射到所述深度学习计算单元库,所述数据流图的边映射为所述节点的逻辑关系,以通过所述深度学习单元库获取神经网络的实现程序。可选的,所述深度学习计算单元库可为适用于嵌入式系统的单元库。
由以上技术方案可见,本实施例提供的面向嵌入式系统的神经网络的映射方法、装置以及系统,能够以深度学习计算单元库为基础,将神经网络映射为应用于嵌入式系统的实现程序,从而能够加快神经网络在嵌入式平台的实现速度,最大化嵌入式平台的性能。
附图说明
图1为根据本发明实施例的面向嵌入式系统的神经网络的映射方法流程图;
图2为根据本发明一个具体实施例的面向嵌入式系统的神经网络的影射方法的流程图;
图3为根据本发明一个具体实施例的面向嵌入式系统的神经网络的影射方法的数据流图的示意图;
图4为根据本发明实施例的面向嵌入式系统的神经网络的映射装置的方框示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
图1为根据本发明实施例的面向嵌入式系统的神经网络的映射方法流程图。如图1所示,本发明实施例的面向嵌入式系统的神经网络的映射方法,包括以下步骤:
S1:建立神经网络结构,并获取神经网络的参数。
根据本发明的一个实施例,神经网络的参数可通过神经网络的深度学习模型训练获取,神经网络的深度学习模型训练过程可由高性能计算机和深度学习框架(例如Caffe、Tensorflow)实现。其中,神经网络的参数指神经元的输入的权重参数,由神经网络的深度学习模型训练过程得到,用于和神经网络的输入信息进行线性运算。
其中,神经网络结构可通过具体的神经网络结构的描述文件进行建立。
S2:根据神经网络结构和神经网络的参数生成描述神经网络的数据流图。
需要说明的是,神经网络的数据流图包括节点和边,其中,节点代表神经网络结构的基本算子,边表示数据的流向,即节点的运算具有方向性,其决定了数据流图中节点的执行顺序。也就是说,可通过数据流图的有向边反映数据流图的节点的逻辑顺序。
S3:获取深度学习计算单元库,并利用深度学习计算单元库实现神经网络的数据流图,以获取神经网络的实现程序。
根据本发明的一个实施例,将数据流图的节点映射到深度学习计算单元库,数据流图的边映射为节点的逻辑关系,以通过深度学习单元库获取神经网络的实现程序。具体地,深度学习计算单元库为适用于嵌入式系统的单元库。
需要说明的是,深度学习计算单元库是一组实现深度神经网络基本运算(如卷积运算、下采样运算、全连接运算等)的软件函数库。为了充分发挥硬件性能,提升神经网络计算的性能,针对不同硬件平台,深度学习计算单元库有不同的实现,比如CuDNN是针对英伟达计算平台设计的深度学习计算单元库,提供在英伟达计算平台上高效的神经网络基本运算。如果某个计算平台没有专门的深度学习计算单元库,需要根据计算平台的特点,定制一组神经网络基本运算的软件函数库,定制的难点是需要充分了解面向的计算平台的特点,高效地利用硬件平台特有的硬件资源,匹配算法和硬件资源的特性。
深度学习计算单元库可实现卷积、非限定变换和下采样等基本算子,并针对嵌入式平台进行了优化,用向量运算指令优化卷积运算和下采样运算,能够降低运算的延时时间,支持可变字长的定点运算,通过字长优化技术,降低模型参数的字长,减少神经网络对嵌入式系统的内存的消耗。
根据本发明的一个具体实施例,如图2所示,首先获取神经网络结构,对该神经网络结构进行深度学习模型训练以获取该神经网络的参数,根据该神经网络结构与该神经网络的参数生成描述该神经网络的数据流图,即得到该神经网络各基本算子先后顺序和逻辑流程,例如图3所示,该神经网络将输入的神经元依次通过卷积运算、非线性变换和均值下采样运算,以图像识别为例,将图像输入神经网络,经过若干次卷积运算、非线性变换和均值下采样运算后可得到一组特征图,全连接层可利用特征图实现图像分类和检测等功能。其中,卷积运算可由卷积滤波和激活函数级联构成,对于卷积滤波操作,卷积核以滑动窗口的形式与窗口中的图像做卷积运算,非线性激活函数(例如sigmoid)对卷积的结果做非线性变换。下采样运算通过均值或最值的方式实现下采样,具体是以滑动串口的方式计算窗口内图像的均值或最大(小)值,用得到的均值或最值代表原始窗口内的图像,在本发明实施例中采用均值下采样。
然后获取适用于目标嵌入式系统的深度学习计算单元库,利用深度学习计算单元库实现神经网络的数据流图,即使用深度学习计算单元库中的基本算子实现数据流图中的节点,根据数据流图的边确定各节点的逻辑顺序,从而获取神经网络的实现程序。
综上所述,根据本发明实施例的面向嵌入式系统的神经网络的映射方法,能够以深度学习计算单元库为基础,将神经网络映射为应用于嵌入式系统的实现程序,从而能够加快神经网络在嵌入式平台的实现速度,最大化嵌入式平台的性能。
本发明实施例还提出了一种面向嵌入式系统的神经网络系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现面向嵌入式系统的神经网络的映射方法。
根据本发明实施例的面向嵌入式系统的神经网络系统,通过面向嵌入式系统的神经网络的映射方法,能够以深度学习计算单元库为基础,将神经网络映射为应用于嵌入式系统的实现程序,从而能够加快神经网络在嵌入式平台的实现速度,最大化嵌入式平台的性能。
本发明实施例还提出了一种计算机可读存储介质,包括程序,程序能够被处理器执行以实现面向嵌入式系统的神经网络的映射方法。
根据本发明实施例的计算机可读存储介质,通过面向嵌入式系统的神经网络的映射方法,能够以深度学习计算单元库为基础,将神经网络映射为应用于嵌入式系统的实现程序,从而能够加快神经网络在嵌入式平台的实现速度,最大化嵌入式平台的性能。
与上述几种实施例提供的面向嵌入式系统的神经网络的映射方法相对应,本发明的一种实施例还提供了面向嵌入式系统的神经网络的映射装置,由于本发明实施例提供的面向嵌入式系统的神经网络的映射装置与上述几种实施例提供的面向嵌入式系统的神经网络的映射方法相对应,因此在前述面向嵌入式系统的神经网络的映射方法的实施方式也适用于本实施例提供的面向嵌入式系统的神经网络的映射装置,在本实施例中不再描述。
图4为根据本发明实施例的面向嵌入式系统的神经网络的映射装置的方框示意图。如图4所示,本发明实施例的面向嵌入式系统的神经网络的映射装置包括:第一获取单元10、编译器20和第二获取单元30。
其中,第一获取单元10用于获取神经网络结构和神经网络的参数;编译器20用于根据神经网络结构和神经网络的参数生成描述神经网络的数据流图;第二获取单元30用于获取深度学习计算单元库,并利用深度学习计算单元库实现神经网络的数据流图,以获取神经网络的实现程序。
根据本发明的一个实施例,神经网络的参数通过神经网络的深度学习模型训练获取。
根据本发明的一个实施例,数据流图的具有节点和边,装置可还包括:将数据流图的节点映射到深度学习计算单元库,数据流图的边映射为节点的逻辑关系,以通过深度学习单元库获取神经网络的实现程序。
根据本发明的一个实施例,深度学习计算单元库为适用于嵌入式系统的单元库。
综上所述,根据本发明实施例的面向嵌入式系统的神经网络的映射装置能够以深度学习计算单元库为基础,将神经网络映射为应用于嵌入式系统的实现程序,从而能够加快神经网络在嵌入式平台的实现速度,最大化嵌入式平台的性能。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种面向嵌入式系统的神经网络的映射方法,其特征在于,包括以下步骤:
建立所述神经网络结构,并获取所述神经网络的参数;
根据所述神经网络结构和所述神经网络的参数生成描述所述神经网络的数据流图;
获取深度学习计算单元库,并利用深度学习计算单元库实现神经网络的数据流图,以获取神经网络的实现程序。
2.如权利要求1所述的方法,其特征在于,所述神经网络的参数通过神经网络的深度学习模型训练获取。
3.如权利要求1所述的方法,其特征在于,所述数据流图的具有节点和边,所述方法还包括:将所述数据流图的节点映射到所述深度学习计算单元库,所述数据流图的边映射为所述节点的逻辑关系,以通过所述深度学习单元库获取神经网络的实现程序。
4.如权利要求1或3所述的方法,其特征在于,所述深度学习计算单元库为适用于嵌入式系统的单元库。
5.一种面向嵌入式系统的神经网络系统,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-4中任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-4中任一项所述的方法。
7.一种面向嵌入式系统的神经网络的映射装置,其特征在于,包括:
第一获取单元,用于获取所述神经网络结构和所述神经网络的参数;
编译器,用于根据所述神经网络结构和所述神经网络的参数生成描述所述神经网络的数据流图;
第二获取单元,用于获取深度学习计算单元库,并利用深度学习计算单元库实现神经网络的数据流图,以获取神经网络的实现程序。
8.如权利要求7所述的装置,其特征在于,所述神经网络的参数通过神经网络的深度学习模型训练获取。
9.如权利要求7所述的装置,其特征在于,所述数据流图的具有节点和边,所述装置还包括:将所述数据流图的节点映射到所述深度学习计算单元库,所述数据流图的边映射为所述节点的逻辑关系,以通过所述深度学习单元库获取神经网络的实现程序。
10.如权利要求7或9所述的装置,其特征在于,所述深度学习计算单元库为适用于嵌入式系统的单元库。
CN201711162662.9A 2017-11-21 2017-11-21 面向嵌入式系统的神经网络的映射方法及装置 Pending CN107958285A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711162662.9A CN107958285A (zh) 2017-11-21 2017-11-21 面向嵌入式系统的神经网络的映射方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711162662.9A CN107958285A (zh) 2017-11-21 2017-11-21 面向嵌入式系统的神经网络的映射方法及装置

Publications (1)

Publication Number Publication Date
CN107958285A true CN107958285A (zh) 2018-04-24

Family

ID=61965163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711162662.9A Pending CN107958285A (zh) 2017-11-21 2017-11-21 面向嵌入式系统的神经网络的映射方法及装置

Country Status (1)

Country Link
CN (1) CN107958285A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726683A (zh) * 2018-12-29 2019-05-07 北京市商汤科技开发有限公司 目标对象检测方法和装置、电子设备和存储介质
US10390003B1 (en) 2016-08-29 2019-08-20 Perceptln Shenzhen Limited Visual-inertial positional awareness for autonomous and non-autonomous device
CN110598855A (zh) * 2019-09-23 2019-12-20 Oppo广东移动通信有限公司 深度学习模型生成方法、装置、设备及存储介质
CN111028226A (zh) * 2019-12-16 2020-04-17 北京百度网讯科技有限公司 算法移植的方法及装置
CN111104120A (zh) * 2018-10-29 2020-05-05 赛灵思公司 神经网络编译方法、系统及相应异构计算平台
CN111340175A (zh) * 2018-12-18 2020-06-26 赛灵思公司 图重写的处理方法及装置、计算设备及可读介质
WO2021134231A1 (zh) * 2019-12-30 2021-07-08 深圳元戎启行科技有限公司 基于推理引擎的计算资源分配方法、装置和计算机设备
US11328158B2 (en) 2016-08-29 2022-05-10 Trifo, Inc. Visual-inertial positional awareness for autonomous and non-autonomous tracking
US11501527B2 (en) 2016-08-29 2022-11-15 Trifo, Inc. Visual-inertial positional awareness for autonomous and non-autonomous tracking
US11774983B1 (en) 2019-01-02 2023-10-03 Trifo, Inc. Autonomous platform guidance systems with unknown environment mapping
US11842500B2 (en) 2016-08-29 2023-12-12 Trifo, Inc. Fault-tolerance to provide robust tracking for autonomous and non-autonomous positional awareness
US11953910B2 (en) 2016-08-29 2024-04-09 Trifo, Inc. Autonomous platform guidance systems with task planning and obstacle avoidance

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673343A (zh) * 2009-10-15 2010-03-17 上海大学 在dsp+fpga架构中提高信号实时模式识别处理速度的系统及方法
CN102269972A (zh) * 2011-03-29 2011-12-07 东北大学 基于遗传神经网络的管道压力缺失数据补偿方法及装置
US20140131325A1 (en) * 2012-11-13 2014-05-15 Adaptive Intelligent Systems Llc Method to plasma arc weld and full-position pipe weld
CN106204499A (zh) * 2016-07-26 2016-12-07 厦门大学 基于卷积神经网络的单幅图像去雨方法
CN106408038A (zh) * 2016-09-09 2017-02-15 华南理工大学 一种基于卷积神经网络模型的旋转汉字识别方法
CN107239829A (zh) * 2016-08-12 2017-10-10 北京深鉴科技有限公司 一种优化人工神经网络的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673343A (zh) * 2009-10-15 2010-03-17 上海大学 在dsp+fpga架构中提高信号实时模式识别处理速度的系统及方法
CN102269972A (zh) * 2011-03-29 2011-12-07 东北大学 基于遗传神经网络的管道压力缺失数据补偿方法及装置
US20140131325A1 (en) * 2012-11-13 2014-05-15 Adaptive Intelligent Systems Llc Method to plasma arc weld and full-position pipe weld
CN106204499A (zh) * 2016-07-26 2016-12-07 厦门大学 基于卷积神经网络的单幅图像去雨方法
CN107239829A (zh) * 2016-08-12 2017-10-10 北京深鉴科技有限公司 一种优化人工神经网络的方法
CN106408038A (zh) * 2016-09-09 2017-02-15 华南理工大学 一种基于卷积神经网络模型的旋转汉字识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JUNLI GU 等: "OpenCL caffe: Accelerating and enabling a cross platform machine learning framework", 《PROCEEDING OF THE 4TH INTERNATIONAL WORKSHOP ON OPENCL.ACM》 *
SUBARNA TRIPATHI 等: "LCDet: Low-Complexity Fully-Convolutional Neural Networks for Object Detection in Embedded Systems", 《COMPUTER VISION FOUNDATION》 *
王羽: "基于FPGA的卷积神经网络应用研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *
郭吉政: "免疫卷积神经网络并行优化及其嵌入式系统应用", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11328158B2 (en) 2016-08-29 2022-05-10 Trifo, Inc. Visual-inertial positional awareness for autonomous and non-autonomous tracking
US10390003B1 (en) 2016-08-29 2019-08-20 Perceptln Shenzhen Limited Visual-inertial positional awareness for autonomous and non-autonomous device
US11953910B2 (en) 2016-08-29 2024-04-09 Trifo, Inc. Autonomous platform guidance systems with task planning and obstacle avoidance
US11900536B2 (en) 2016-08-29 2024-02-13 Trifo, Inc. Visual-inertial positional awareness for autonomous and non-autonomous tracking
US11842500B2 (en) 2016-08-29 2023-12-12 Trifo, Inc. Fault-tolerance to provide robust tracking for autonomous and non-autonomous positional awareness
US11501527B2 (en) 2016-08-29 2022-11-15 Trifo, Inc. Visual-inertial positional awareness for autonomous and non-autonomous tracking
CN111104120A (zh) * 2018-10-29 2020-05-05 赛灵思公司 神经网络编译方法、系统及相应异构计算平台
CN111104120B (zh) * 2018-10-29 2023-12-22 赛灵思公司 神经网络编译方法、系统及相应异构计算平台
CN111340175A (zh) * 2018-12-18 2020-06-26 赛灵思公司 图重写的处理方法及装置、计算设备及可读介质
CN111340175B (zh) * 2018-12-18 2023-12-26 赛灵思公司 图重写的处理方法及装置、计算设备及可读介质
CN109726683B (zh) * 2018-12-29 2021-06-22 北京市商汤科技开发有限公司 目标对象检测方法和装置、电子设备和存储介质
US11423666B2 (en) 2018-12-29 2022-08-23 Beijing Sensetime Technology Development Co., Ltd. Method of detecting target object detection method and device for detecting target object, electronic apparatus and storage medium
CN109726683A (zh) * 2018-12-29 2019-05-07 北京市商汤科技开发有限公司 目标对象检测方法和装置、电子设备和存储介质
US11774983B1 (en) 2019-01-02 2023-10-03 Trifo, Inc. Autonomous platform guidance systems with unknown environment mapping
WO2021057807A1 (zh) * 2019-09-23 2021-04-01 Oppo广东移动通信有限公司 深度学习模型生成方法、装置、设备及存储介质
CN110598855A (zh) * 2019-09-23 2019-12-20 Oppo广东移动通信有限公司 深度学习模型生成方法、装置、设备及存储介质
CN111028226A (zh) * 2019-12-16 2020-04-17 北京百度网讯科技有限公司 算法移植的方法及装置
WO2021134231A1 (zh) * 2019-12-30 2021-07-08 深圳元戎启行科技有限公司 基于推理引擎的计算资源分配方法、装置和计算机设备
CN113412493A (zh) * 2019-12-30 2021-09-17 深圳元戎启行科技有限公司 基于推理引擎的计算资源分配方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
CN107958285A (zh) 面向嵌入式系统的神经网络的映射方法及装置
Lu et al. Video object segmentation with episodic graph memory networks
US11783227B2 (en) Method, apparatus, device and readable medium for transfer learning in machine learning
CN107977704B (zh) 权重数据存储方法和基于该方法的神经网络处理器
KR102582194B1 (ko) 선택적 역전파
US10282864B1 (en) Method and device for encoding image and testing method and testing device using the same
CN112183718B (zh) 一种用于计算设备的深度学习训练方法和装置
CN109840531A (zh) 训练多标签分类模型的方法和装置
TW201627923A (zh) 模型壓縮和微調
CN107610146A (zh) 图像场景分割方法、装置、计算设备及计算机存储介质
CN109118504B (zh) 一种基于神经网络的图像边缘检测方法、装置及其设备
CN110222718B (zh) 图像处理的方法及装置
CN107730514A (zh) 场景分割网络训练方法、装置、计算设备及存储介质
Djemame et al. Solving reverse emergence with quantum PSO application to image processing
CN108875693A (zh) 一种图像处理方法、装置、电子设备及其存储介质
CN107590811A (zh) 基于场景分割的风景图像处理方法、装置及计算设备
WO2023040147A1 (zh) 神经网络的训练方法及装置、存储介质和计算机程序
CN111738403A (zh) 一种神经网络的优化方法及相关设备
CN111931901A (zh) 一种神经网络构建方法以及装置
CN115018039A (zh) 一种神经网络蒸馏方法、目标检测方法以及装置
EP3973501A1 (en) Dynamic image resolution assessment
CN116432736A (zh) 神经网络模型优化方法、装置及计算设备
CN114626500A (zh) 一种神经网络计算方法及相关设备
CN112884648A (zh) 多类模糊图像超分辨率重建的方法和系统
WO2022127603A1 (zh) 一种模型处理方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180424

RJ01 Rejection of invention patent application after publication