CN110674923A - 一种多神经网络框架间的快速模型验证方法 - Google Patents
一种多神经网络框架间的快速模型验证方法 Download PDFInfo
- Publication number
- CN110674923A CN110674923A CN201910751846.1A CN201910751846A CN110674923A CN 110674923 A CN110674923 A CN 110674923A CN 201910751846 A CN201910751846 A CN 201910751846A CN 110674923 A CN110674923 A CN 110674923A
- Authority
- CN
- China
- Prior art keywords
- file
- neural network
- model
- format
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种多神经网络框架间的快速模型验证方法,属于计算机视觉技术领域,所述方法包括以下步骤:(1)搭建pytorch框架环境,导入torch、torch.nn库。(2)基于pytorch框架环境搭建神经网络模型并进行调试,生成格式为.pth的文件。(3)使用torch与caffe间的转换工具,将格式为.pth的文件转换为格式为.caffemodel及prototxt的caffe框架下的文件。(4)搭建caffe框架环境,并验证转换后的文件是否正常运行。(5)验证该模型在实际应用中的可行性。本发明降低了神经网络的开发与调试难度,有效缩短了神经网络模型的研发和应用周期。
Description
技术领域
本发明涉及一种多神经网络框架间的快速模型验证方法,属于计算机视觉、计算机软件技术领域。
背景技术
在运用深度学习方法训练神经网络的产品化的过程中,通常使用的是caffe框架,如华为海思35XX系列监控处理芯片,英特尔神经棒一代,二代,腾讯的NCNN,小米的MACE框架,都只支持在caffe训练出的模型格式,目前工业界对pytorch的支持还不完善。但caffe框架出现时期较早,专注于计算机视觉领域,在该框架下研发新的模型需要的代码冗长,调试较为麻烦,研发周期较长。而pytorch框架出现的较晚,是一个通用的框架,其框架下神经网络模型的研发所需代码较为简单,调试较为方便,研发周期较短。
在相同硬件条件下,caffe比pytorch训练速度更快,精度更高,但较难上手,不容易编写模型。Pytorch相比caffe较容易上手,编写和调试模型更为方便。使用pytorch搭建模型的速度更快,调试更快。相比较之下能使研发周期变短。目前并没有将二者融合的有效方法。
目前已有的深度学习方法训练神经网络并产品化的方法,大多是在caffe框架之中直接进行开发并调试,且由于caffe框架的代码冗长,结构不清晰,在开发及调试过程中需要大量时间,使得研发周期变得很长。且便于研发使用的pytorch框架移植到caffe框架下后需要在caffe框架下重新训练模型,开发时间长。故此提出一种多框架间的快速移植方法进行研发调试,缩短研发周期,具有较强的实用意义。
发明内容
针对现有技术的不足,本发明提供一种多神经网络框架间的快速模型验证方法。
本发明的技术方案如下:
一种多神经网络框架间的快速模型验证方法,所述方法包括以下步骤:
(1)搭建pytorch框架环境,导入torch库、torch.nn库;
(2)基于pytorch框架环境搭建神经网络模型并进行调试,生成格式为.pth的文件;
(3)使用torch与caffe间的转换工具,将格式为.pth的文件转换为格式为.caffemodel及prototxt的caffe框架下的文件;
(4)搭建caffe框架环境,并验证转换后的文件是否正常运行;
(5)验证该模型在实际应用中的可行性,将模型写入需要使用该模型的产品中,观察是否能输出规定输出的文件,测试该产品是否能正常工作。
进一步地,步骤(1)中,安装所需python版本,下载相关python包管理工具,安装对应版本的pytorch和torchvision,其中torchvision用以通过可视化协助搭建者调试神经网络模型,加快网络开发速度,安装完成后运行demo测试是否安装成功。
进一步地,步骤(2)中,在pytorch框架环境下搭建神经网络模型,模型包括数据集处理文件、网络模型文件、网络训练文件、网络测试文件、可视化文件;
数据集处理文件用以教导神经网络训练和测试使用的数据集按照规定的规则进行解压、处理,以及进行数据集的转换与划分;网络模型文件用以定义神经网络的结构,神经网络的结构包括每层滤波器的数量、滤波器大小及参数、初始化方式;网络训练文件用以定义该神经网络模型在训练过程中使用训练数据集进行训练,并将训练结果反馈至模型文件对神经网络模型进行优化;网络测试文件用以定义训练完成的网络使用测试数据集对网络模型进行测试,如有必要,可调试后再次训练网络模型,并进行测试;可视化文件用以定义将网络测试效果使用图表形式可视化,方便搭建者直接观察测试效果和对神经网络进行调试。
再进一步,步骤(2)中,pytorch框架下的神经网络模型在训练、优化、调试完毕后,根据源代码生成格式为.pth的文件。
进一步地,步骤(3)中,在Github上下载相关开源的转换工具,转换工具为pytorch2caffe、onnx中的其中一种,参照转换工具的工程文件中的README.md文件将pytorch框架下的格式为.pth的文件转化为格式为.caffemodel及prototxt的文件。
进一步地,步骤(4)中,安装对应版本的caffe,将格式为.caffemodel和prototxt的文件导入至caffe框架中,测试是否正常运行,观察运行完毕后是否输出规定的输出文件,若不报错,则说明输出正常,输出文件由模型确定。
本发明的有益效果在于:
本发明的方案使用pytorch框架进行研发调试,缩短了研发周期,之后转化为caffe框架并产品化。在相同硬件条件下,caffe比pytorch训练速度更快,精度更高,但较难上手,不容易编写模型。Pytorch相比caffe较容易上手,编写和调试模型更为方便。使用pytorch搭建模型的速度更快,调试更快。本发明降低了神经网络的开发与调试难度,相比较之下能有效缩短研发和应用周期。
附图说明
附图1是本发明方法的流程图。
具体实施方式
下面通过实施例并结合附图对本发明做进一步说明,但不限于此。
实施例1:
如图1所示,一种多神经网络框架间的快速模型验证方法,包括如下步骤:
(1)搭建pytorch框架环境,导入torch库、torch.nn库。
安装所需python版本,下载相关python包管理工具,安装对应版本的pytorch和torchvision,其中torchvision可以通过可视化协助搭建者调试神经网络模型,加快网络开发速度。安装完成后运行demo测试是否安装成功。
(2)基于pytorch框架环境搭建神经网络模型并进行调试,生成格式为.pth的文件。
在pytorch框架环境下搭建神经网络模型,模型包括数据集处理文件、网络模型文件、网络训练文件、网络测试文件、可视化文件。
数据集处理文件定义了神经网络训练和测试使用的数据集将如何按照规定的规则进行解压、处理,以及如何进行数据集的转换与划分。网络模型文件定义了神经网络的结构,包括每层有多少滤波器、滤波器大小及参数、初始化方式。网络训练文件定义了该神经网络模型在训练过程中将如何使用训练数据集进行训练,并怎样将训练结果反馈至模型文件对神经网络模型进行优化。网络测试文件定义了训练完成的网络将如何使用测试数据集对网络模型进行测试,如有必要,可调试后再次训练网络模型,并进行测试。可视化文件定义了如何将网络测试效果使用图表形式可视化,方便搭建者直接观察测试效果和对神经网络进行调试。
pytorch框架下的神经网络模型在训练、优化、调试完毕后,根据源代码生成格式为.pth的文件。
(3)使用torch与caffe间的转换工具,将格式为.pth等的文件转换为格式为.caffemodel的caffe框架下的文件。
首先在Github上下载相关开源的转化工具,如pytorch2caffe、onnx。参照转换工具的工程文件中的README.md文件将pytorch框架下的格式为.pth的文件转化为格式为.caffemodel及prototxt的文件。
(4)搭建caffe框架环境,并验证转换后的文件是否正常运行。
安装对应版本的caffe。将格式为.caffemodel和prototxt的文件导入至caffe框架中,测试是否正常运行。观察运行完毕后是否输出规定输出的文件。
(5)验证该模型在实际应用中的可行性。
将模型写入需要使用该模型的产品中,观察是否能输出规定输出的文件,测试该产品是否能正常工作。
Claims (6)
1.一种多神经网络框架间的快速模型验证方法,其特征在于,所述方法包括以下步骤:
(1)搭建pytorch框架环境,导入torch库、torch.nn库;
(2)基于pytorch框架环境搭建神经网络模型并进行调试,生成格式为.pth的文件;
(3)使用torch与caffe间的转换工具,将格式为.pth的文件转换为格式为.caffemodel及prototxt的caffe框架下的文件;
(4)搭建caffe框架环境,并验证转换后的文件是否正常运行;
(5)验证该模型在实际应用中的可行性,将模型写入需要使用该模型的产品中,观察是否能输出规定输出的文件,测试该产品是否能正常工作。
2.根据权利要求1所述的多神经网络框架间的快速模型验证方法,其特征在于,步骤(1)中,安装所需python版本,下载python包管理工具,安装对应版本的pytorch和torchvision,其中torchvision用以通过可视化协助搭建者调试神经网络模型,安装完成后运行demo测试是否安装成功。
3.根据权利要求1所述的多神经网络框架间的快速模型验证方法,其特征在于,步骤(2)中,在pytorch框架环境下搭建神经网络模型,模型包括数据集处理文件、网络模型文件、网络训练文件、网络测试文件、可视化文件;
数据集处理文件用以教导神经网络训练和测试使用的数据集按照规定的规则进行解压、处理,以及进行数据集的转换与划分;网络模型文件用以定义神经网络的结构,神经网络的结构包括每层滤波器的数量、滤波器大小及参数、初始化方式;网络训练文件用以定义该神经网络模型在训练过程中使用训练数据集进行训练,并将训练结果反馈至模型文件对神经网络模型进行优化;网络测试文件用以定义训练完成的网络使用测试数据集对网络模型进行测试;可视化文件用以定义将网络测试效果使用图表形式可视化。
4.根据权利要求3所述的多神经网络框架间的快速模型验证方法,其特征在于,步骤(2)中,pytorch框架下的神经网络模型在训练、优化、调试完毕后,根据源代码生成格式为.pth的文件。
5.根据权利要求1所述的多神经网络框架间的快速模型验证方法,其特征在于,步骤(3)中,在Github上下载相关开源的转换工具,转换工具为pytorch2caffe、onnx中的其中一种,参照转换工具的工程文件中的README.md文件将pytorch框架下的格式为.pth的文件转化为格式为.caffemodel及prototxt的文件。
6.根据权利要求1所述的多神经网络框架间的快速模型验证方法,其特征在于,步骤(4)中,安装对应版本的caffe,将格式为.caffemodel和prototxt的文件导入至caffe框架中,测试是否正常运行,观察运行完毕后是否输出规定的输出文件,若不报错,则说明输出正常,输出文件由模型确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910751846.1A CN110674923A (zh) | 2019-08-15 | 2019-08-15 | 一种多神经网络框架间的快速模型验证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910751846.1A CN110674923A (zh) | 2019-08-15 | 2019-08-15 | 一种多神经网络框架间的快速模型验证方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110674923A true CN110674923A (zh) | 2020-01-10 |
Family
ID=69075335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910751846.1A Pending CN110674923A (zh) | 2019-08-15 | 2019-08-15 | 一种多神经网络框架间的快速模型验证方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674923A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814906A (zh) * | 2020-07-23 | 2020-10-23 | 上海东普信息科技有限公司 | 快递面单识别模型移植方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423817A (zh) * | 2017-04-17 | 2017-12-01 | 星环信息科技(上海)有限公司 | 一种深度学习实现的方法及设备 |
CN109032671A (zh) * | 2018-06-25 | 2018-12-18 | 电子科技大学 | 一种基于数据并行策略的分布式深度学习方法及系统 |
CN109460827A (zh) * | 2018-11-01 | 2019-03-12 | 郑州云海信息技术有限公司 | 一种深度学习环境的搭建与优化方法和系统 |
CN109740725A (zh) * | 2019-01-25 | 2019-05-10 | 网易(杭州)网络有限公司 | 神经网络模型运行方法及装置、以及存储介质 |
CN109753864A (zh) * | 2018-09-24 | 2019-05-14 | 天津大学 | 一种基于caffe深度学习框架的人脸识别方法 |
-
2019
- 2019-08-15 CN CN201910751846.1A patent/CN110674923A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423817A (zh) * | 2017-04-17 | 2017-12-01 | 星环信息科技(上海)有限公司 | 一种深度学习实现的方法及设备 |
CN109032671A (zh) * | 2018-06-25 | 2018-12-18 | 电子科技大学 | 一种基于数据并行策略的分布式深度学习方法及系统 |
CN109753864A (zh) * | 2018-09-24 | 2019-05-14 | 天津大学 | 一种基于caffe深度学习框架的人脸识别方法 |
CN109460827A (zh) * | 2018-11-01 | 2019-03-12 | 郑州云海信息技术有限公司 | 一种深度学习环境的搭建与优化方法和系统 |
CN109740725A (zh) * | 2019-01-25 | 2019-05-10 | 网易(杭州)网络有限公司 | 神经网络模型运行方法及装置、以及存储介质 |
Non-Patent Citations (4)
Title |
---|
HANMIAOBEI7428: ""如何将pytorch模型用于Tengine平台"", 《HTTPS://BLOG.CSDN.NET/HANMIAOBEI7428/ARTICLE/DETAILS/85337528》 * |
SUPERHUI: ""三. caffe2&pytorch之在移动端部署深度学习模型(全过程!)"", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/32342366》 * |
VVNZHANG2095: ""pytorch转caffe步骤"", 《HTTPS://BLOG.CSDN.NET/VVNZHANG2095/ARTICLE/DETAILS/91439924》 * |
波波是宽宽: ""pytorch模型转caffe模型"", 《HTTPS://BLOG.CSDN.NET/WEIXIN_38501242/ARTICLE/DETAILS/82624071》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814906A (zh) * | 2020-07-23 | 2020-10-23 | 上海东普信息科技有限公司 | 快递面单识别模型移植方法、装置、设备及存储介质 |
CN111814906B (zh) * | 2020-07-23 | 2023-07-11 | 上海东普信息科技有限公司 | 快递面单识别模型移植方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110865607A (zh) | 一种基于数字孪生的五轴数控机床控制方法 | |
CN105373478B (zh) | 自动化测试方法和系统 | |
CN107844424A (zh) | 基于模型的测试系统及方法 | |
CN109032577B (zh) | 一种数据仿真方法 | |
CN108459951B (zh) | 测试方法和装置 | |
CN109344074B (zh) | 一种跨平台自动化测试方法及系统 | |
CN111737154A (zh) | 基于uft的车联网自动化测试方法及装置 | |
CN113868120A (zh) | 工业软件调试方法、装置、计算机设备和存储介质 | |
JP2006134284A (ja) | データ生成方法 | |
CN112346987A (zh) | 基于Xmind的测试用例生成转换方法及系统 | |
CN106354629A (zh) | 一种基于多级服务器的iOS系统移动应用自动测试系统的架构方法 | |
CN114186697A (zh) | 基于深度学习框架生成和应用深度学习模型的方法及装置 | |
CN107622017A (zh) | 一种通用自动化软件测试的解析方法 | |
CN110674923A (zh) | 一种多神经网络框架间的快速模型验证方法 | |
CN117909864A (zh) | 一种电力故障预测系统及方法 | |
CN112462713A (zh) | 一种图形化逻辑控制系统、方法、设备和可读存储介质 | |
CN1983280A (zh) | 用于在模型上实现动作的方法和系统 | |
CN104731705A (zh) | 一种基于复杂网络的脏数据传播路径发现方法 | |
CN109508204B (zh) | 一种前端代码质量检测方法及装置 | |
Nozhenkova et al. | Creation of the base of a simulation model’s precedents for analysis of the spacecraft onboard equipment testing results | |
Rapos et al. | Simevo: A toolset for simulink test evolution & maintenance | |
CN116402325A (zh) | 业务流程自动化处理方法及装置 | |
Liu et al. | OF-PENDA: A Software Tool for Fault Diagnosis of Discrete Event Systems Modeled by Labeled Petri Nets. | |
CN112465244B (zh) | 一种基于TensorFlow的工业设备预检预修模型的训练方法及装置 | |
CN109710537B (zh) | 一种智能自动化测试方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200110 |
|
WD01 | Invention patent application deemed withdrawn after publication |