CN111209013A - 一种高效的深度学习后端模型部署框架 - Google Patents
一种高效的深度学习后端模型部署框架 Download PDFInfo
- Publication number
- CN111209013A CN111209013A CN202010041804.1A CN202010041804A CN111209013A CN 111209013 A CN111209013 A CN 111209013A CN 202010041804 A CN202010041804 A CN 202010041804A CN 111209013 A CN111209013 A CN 111209013A
- Authority
- CN
- China
- Prior art keywords
- module
- model
- algorithm
- deep learning
- deployment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 37
- 230000001133 acceleration Effects 0.000 claims abstract description 17
- 238000005457 optimization Methods 0.000 claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims abstract description 14
- 238000013136 deep learning model Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 210000001503 joint Anatomy 0.000 claims description 2
- 238000012805 post-processing Methods 0.000 claims description 2
- 238000009517 secondary packaging Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 abstract description 5
- 238000011161 development Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Stored Programmes (AREA)
Abstract
本发明涉及人工智能模型的技术领域,特别是涉及一种高效的深度学习后端模型部署框架,以当前市面上最优的算法作为基础,以算法库文件为纽带,实现了深度学习模型由python端部署至服务器的功能,开发人员只需要根据自己的模型部署到任何服务器,降低了深度学习模型部署的难度,提高了开发人员的工作效率以及深度学习模型算法的落地能力,模型部署采用onnx文件,当模型网络结构发生变化时,只需要相应的修改onnx文件即可完成重新部署;包括算法模块、优化模块、转换模块、加速模块、算法库模块和部署模块,算法模块、优化模块、转换模块、加速模块、算法库模块和部署模块为呈金字塔结构的关系,算法模块为框架提供基础的算法。
Description
技术领域
本发明涉及人工智能模型的技术领域,特别是涉及一种高效的深度学习后端模型部署框架。
背景技术
众所周知,近几年人工智能的飞速发展,模型也越来越大、越来越多,许多与识别、检测等相关的成套业务可以部署到服务器上,但是模型要求也越来越高,速度与精度的追求也涌现出许多优秀的方案和产品。而人工智能模型的高效运行是人工智能产品中繁琐且重要的环节,为了提高模型的效率发明了一种高效的深度学习模型部署框架,该框架使用java、C++开发并部署模型。目前在人工智能领域中,存在许多优秀的深度学习模型部署框架,如tensorflow、mxnet等,但该类的深度学习模型部署框架更多的是考虑内部使用,因此无法适用其它框架的模型;现有的深度学习模型部署框架仍处于开发和优化阶段,将其用于产品的开发可能存在隐患且不利于后期维护;且现有的模型运行效率较低。
发明内容
为解决上述技术问题,本发明提供一种融合最优算法,能够支持多框架模型训练,模型部署灵活方便,便于维护管理的高效的深度学习后端模型部署框架。
本发明的一种高效的深度学习后端模型部署框架,包括算法模块、优化模块、转换模块、加速模块、算法库模块和部署模块,算法模块、优化模块、转换模块、加速模块、算法库模块和部署模块为呈金字塔结构的关系,算法模块为框架提供基础的算法,优化模块在模型框架的基础上很少损失精度的情况下加速模型,转换模块统一模型结构,加速模块为整个深度学习模型进行第二次封装加速,算法库模块为模型与后台提供对接桥梁,部署模块用于部署模型处理数据及逻辑、向外提供请求。
本发明的一种高效的深度学习后端模型部署框架,算法模块包括卷积、池化、全连接、图像处理等算法,算法模块使用python、C++编写并训练模型作为深度学习框架的最底层,为整个深度学习框架提供算法基础。
本发明的一种高效的深度学习后端模型部署框架,优化模块根据模型大小、精度及运行速度进行模型优化。
本发明的一种高效的深度学习后端模型部署框架,转换模块根据模型训练框架编写支持onnx导出代码,统一模型文件,优化模型。
本发明的一种高效的深度学习后端模型部署框架,加速模块通过tensorRT对onnx模型文件进行包装加速。
本发明的一种高效的深度学习后端模型部署框架,算法库模块记录和实现了目前使用热门的数据处理方式,算法库模块支持java、C++端调用,同时也支持opencv预处理,优化处理后期结果。
本发明的一种高效的深度学习后端模型部署框架,部署模块负责进行算法库的调用,service部署、高并发处理、日志处理、异常处理、逻辑处理、向外扩展等。
本发明的一种高效的深度学习后端模型部署框架,整个深度学习框架以算法模块为基础,算法库模块为核心,各模块间相互独立、互不影响。
与现有技术相比本发明的有益效果为:以当前市面上最优的算法作为基础,以算法库文件为纽带,将算法以指定顺序执行,实现了深度学习主干网络在服务器上的加速运行,实现了深度学习模型由python端部署至服务器的功能,同时模型模块实现了实用模型算法的迁移检测、识别和系统部署,是深度学习模型部署至服务器的巨大创新发明,在实际开发部署中,开发人员只需要根据自己的模型部署到任何服务器,降低了深度学习模型部署的难度,提高了开发人员的工作效率以及深度学习模型算法的落地能力,模型部署采用onnx文件,当模型网络结构发生变化时,只需要相应的修改onnx文件即可完成重新部署。
附图说明
图1是本发明框架各模块间关系及结构示意图;
图2是本发明框架的使用流程示意图;
附图中标记:1、算法模块;2、优化模块;3、转换模块;4、加速模块;5、算法库模块;6、部署模块。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1至图2所示,本发明的一种高效的深度学习后端模型部署框架,包括算法模块1、优化模块2、转换模块3、加速模块4、算法库模块5和部署模块6,算法模块1、优化模块2、转换模块3、加速模块4、算法库模块5和部署模块6为呈金字塔结构的关系,算法模块1收集当下通用算法及深度学习中最优的基础算法、图像处理算法及神经网络算法,并将其编写为基础算法作为整个深度学习框架的基础,使用对用的深度学习框架进行模型训练分为配置信息、网络结构、训练参数和模型性能四部分:
配置信息包括网络输入尺寸和网络输出尺寸;
网络结构包括卷积层信息、池化层信息、全连接层信息、Batch Normalization层信息、separable卷积层信息、Depthwise Convolution卷积层信息、激活函数信息、残差网络结构信息、Inception网络结构信息;
训练参数包括学习率、优化器算法、优化器参数、损失函数信息、正则函数、正则系数、批次信息、训练次数、随机种子;
模型性能包括训练集总样本数、训练集各类样本数、验证集总样本数、验证集各类样本数、模型总mAP、模型各类别mAP;
根据框架使用情况及模型情况进行int8量化、剪枝等操作,编写一键转换模型,将pth、h5、pb等模型文件统一输出为onnx文件,统一加载及优化,使用tensorRT包裹onnx文件,进行NVIDA硬件加速,在C/C++端,编写程序调用基本数字图像处理库,封装模型预处理及输出处理,优化处理速度,提供java API、C/C++API及http接口,在java端,通过部署模型,调用C库,优化并发处理、提供API接口及Http接口、处理log日志、提高接口性能等。
本发明的一种高效的深度学习后端模型部署框架,其在工作时,在完成上述动作之前,首先将移动到用户需要的位置。
本发明的一种高效的深度学习后端模型部署框架,以上所述所有部件的安装方式、连接方式或设置方式均为常见机械方式,并且其所有部件的具体结构、型号和系数指标均为其自带技术,只要能够达成其有益效果的均可进行实施,故不在多加赘述。
本发明的一种高效的深度学习后端模型部署框架,在未作相反说明的情况下,“上下左右、前后内外以及垂直水平”等包含在术语中的方位词仅代表该术语在常规使用状态下的方位,或为本领域技术人员理解的俗称,而不应视为对该术语的限制,与此同时,“第一”、“第二”和“第三”等数列名词不代表具体的数量及顺序,仅仅是用于名称的区分,而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。
Claims (8)
1.一种高效的深度学习后端模型部署框架,其特征在于,包括算法模块(1)、优化模块(2)、转换模块(3)、加速模块(4)、算法库模块(5)和部署模块(6),算法模块(1)、优化模块(2)、转换模块(3)、加速模块(4)、算法库模块(5)和部署模块(6)为呈金字塔结构的关系,算法模块(1)为框架提供基础的算法,优化模块(2)在模型框架的基础上很少损失精度的情况下加速模型,转换模块(3)统一模型结构,加速模块(4)为整个深度学习模型进行第二次封装加速,算法库模块(5)为模型与后台提供对接桥梁,部署模块(6)用于部署模型处理数据及逻辑、向外提供请求。
2.如权利要求1所述的一种高效的深度学习后端模型部署框架,其特征在于,算法模块(1)包括卷积、池化、全连接、图像处理等算法,算法模块(1)使用python、C++编写并训练模型作为深度学习框架的最底层,为整个深度学习框架提供算法基础。
3.如权利要求2所述的一种高效的深度学习后端模型部署框架,其特征在于,优化模块(2)根据模型大小、精度及运行速度进行模型优化。
4.如权利要求3所述的一种高效的深度学习后端模型部署框架,其特征在于,转换模块(3)根据模型训练框架编写支持onnx导出代码,统一模型文件,优化模型。
5.如权利要求4所述的一种高效的深度学习后端模型部署框架,其特征在于,加速模块(4)通过tensorRT对onnx模型文件进行包装加速。
6.如权利要求5所述的一种高效的深度学习后端模型部署框架,其特征在于,算法库模块(5)记录和实现了目前使用热门的数据处理方式,算法库模块(5)支持java、C++端调用,同时也支持opencv预处理,优化处理后期结果。
7.如权利要求6所述的一种高效的深度学习后端模型部署框架,其特征在于,部署模块(6)负责进行算法库的调用,service部署、高并发处理、日志处理、异常处理、逻辑处理、向外扩展等。
8.如权利要求7所述的一种高效的深度学习后端模型部署框架,其特征在于,整个深度学习框架以算法模块(1)为基础,算法库模块(5)为核心,各模块间相互独立、互不影响。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010041804.1A CN111209013A (zh) | 2020-01-15 | 2020-01-15 | 一种高效的深度学习后端模型部署框架 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010041804.1A CN111209013A (zh) | 2020-01-15 | 2020-01-15 | 一种高效的深度学习后端模型部署框架 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111209013A true CN111209013A (zh) | 2020-05-29 |
Family
ID=70789687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010041804.1A Pending CN111209013A (zh) | 2020-01-15 | 2020-01-15 | 一种高效的深度学习后端模型部署框架 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111209013A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783974A (zh) * | 2020-08-12 | 2020-10-16 | 成都佳华物链云科技有限公司 | 模型构建及图像处理方法、装置、硬件平台及存储介质 |
CN111797969A (zh) * | 2020-06-23 | 2020-10-20 | 浙江大华技术股份有限公司 | 神经网络模型的转换方法及相关装置 |
CN112394950A (zh) * | 2021-01-19 | 2021-02-23 | 共达地创新技术(深圳)有限公司 | Ai模型部署方法、设备和存储介质 |
CN112927127A (zh) * | 2021-03-11 | 2021-06-08 | 华南理工大学 | 一种运行在边缘设备上的视频隐私数据模糊化方法 |
CN113190877A (zh) * | 2021-04-29 | 2021-07-30 | 网易(杭州)网络有限公司 | 一种模型加载方法、装置、可读存储介质及电子设备 |
CN113448545A (zh) * | 2021-06-23 | 2021-09-28 | 北京百度网讯科技有限公司 | 机器学习模型服务化的方法、设备、存储介质及程序产品 |
CN115098203A (zh) * | 2022-06-17 | 2022-09-23 | 山东浪潮科学研究院有限公司 | 一种多语言适配的机器学习模型库的生成方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180136912A1 (en) * | 2016-11-17 | 2018-05-17 | The Mathworks, Inc. | Systems and methods for automatically generating code for deep learning systems |
WO2018094099A1 (en) * | 2016-11-17 | 2018-05-24 | The Mathworks, Inc. | Systems and methods for automatically generating code for deep learning systems |
CN108881446A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于深度学习的人工智能平台系统 |
CN110378463A (zh) * | 2019-07-15 | 2019-10-25 | 北京智能工场科技有限公司 | 一种人工智能模型标准化训练平台及自动化系统 |
-
2020
- 2020-01-15 CN CN202010041804.1A patent/CN111209013A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180136912A1 (en) * | 2016-11-17 | 2018-05-17 | The Mathworks, Inc. | Systems and methods for automatically generating code for deep learning systems |
WO2018094099A1 (en) * | 2016-11-17 | 2018-05-24 | The Mathworks, Inc. | Systems and methods for automatically generating code for deep learning systems |
CN108881446A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于深度学习的人工智能平台系统 |
CN110378463A (zh) * | 2019-07-15 | 2019-10-25 | 北京智能工场科技有限公司 | 一种人工智能模型标准化训练平台及自动化系统 |
Non-Patent Citations (1)
Title |
---|
科技数码频道: "EasyEdge—AI模型边缘部署的救星 拯救深度学习模型的边缘集成部署", 《搜狐 HTTPS://WWW.SOHU.COM/A/346013049_120330264?P=WECHAT》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111797969A (zh) * | 2020-06-23 | 2020-10-20 | 浙江大华技术股份有限公司 | 神经网络模型的转换方法及相关装置 |
CN111783974A (zh) * | 2020-08-12 | 2020-10-16 | 成都佳华物链云科技有限公司 | 模型构建及图像处理方法、装置、硬件平台及存储介质 |
CN112394950A (zh) * | 2021-01-19 | 2021-02-23 | 共达地创新技术(深圳)有限公司 | Ai模型部署方法、设备和存储介质 |
CN112927127A (zh) * | 2021-03-11 | 2021-06-08 | 华南理工大学 | 一种运行在边缘设备上的视频隐私数据模糊化方法 |
CN113190877A (zh) * | 2021-04-29 | 2021-07-30 | 网易(杭州)网络有限公司 | 一种模型加载方法、装置、可读存储介质及电子设备 |
CN113448545A (zh) * | 2021-06-23 | 2021-09-28 | 北京百度网讯科技有限公司 | 机器学习模型服务化的方法、设备、存储介质及程序产品 |
CN113448545B (zh) * | 2021-06-23 | 2023-08-08 | 北京百度网讯科技有限公司 | 机器学习模型服务化的方法、设备、存储介质及程序产品 |
CN115098203A (zh) * | 2022-06-17 | 2022-09-23 | 山东浪潮科学研究院有限公司 | 一种多语言适配的机器学习模型库的生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111209013A (zh) | 一种高效的深度学习后端模型部署框架 | |
CN108764317B (zh) | 一种基于多路特征加权的残差卷积神经网络图像分类方法 | |
US9477925B2 (en) | Deep neural networks training for speech and pattern recognition | |
KR101644998B1 (ko) | Convolutional Neural Network를 이용하여 비정상 입력 데이터를 검출하는 방법 및 장치 | |
JP7168772B2 (ja) | ニューラルネットワーク捜索方法、装置、プロセッサ、電子機器、記憶媒体及びコンピュータプログラム | |
CN111429885A (zh) | 一种将音频片段映射为人脸嘴型关键点的方法 | |
CN110263162A (zh) | 卷积神经网络及其进行文本分类的方法、文本分类装置 | |
CN108922513A (zh) | 语音区分方法、装置、计算机设备及存储介质 | |
CN110689136B (zh) | 一种深度学习模型获得方法、装置、设备及存储介质 | |
CN108664993B (zh) | 一种密集权重连接的卷积神经网络图像分类方法 | |
CN113241064B (zh) | 语音识别、模型训练方法、装置、电子设备和存储介质 | |
CN111160519B (zh) | 基于结构冗余检测的卷积神经网络模型剪枝方法 | |
CN110020724A (zh) | 一种基于权重显著性的神经网络列稀疏方法 | |
CN111240656A (zh) | 一种高效的深度学习模型部署框架 | |
CN114333074A (zh) | 基于动态轻量高分辨率网络的人体姿态估计方法 | |
CN112132279A (zh) | 卷积神经网络模型压缩方法、装置、设备及存储介质 | |
CN115908833A (zh) | 一种基于改进YOLOv3的轻量级垃圾检测方法 | |
CN113554084A (zh) | 基于剪枝和轻量卷积的车辆再辨识模型压缩方法及系统 | |
CN108039168A (zh) | 声学模型优化方法及装置 | |
CN112162734B (zh) | 一种面向深度学习的模型生成方法 | |
CN109389216A (zh) | 神经网络的动态裁剪方法、装置及存储介质 | |
CN112434635B (zh) | 卷积神经网络特征提取方法、系统、嵌入式设备及介质 | |
CN110163256A (zh) | 基于联合概率矩阵的试卷图像自动核分方法 | |
CN114758191A (zh) | 一种图像识别方法、装置及电子设备和存储介质 | |
KR102002549B1 (ko) | 다단계 분류모델 생성 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200529 |