CN113806574A - 一种软硬件一体化的人工智能图像识别数据处理方法 - Google Patents
一种软硬件一体化的人工智能图像识别数据处理方法 Download PDFInfo
- Publication number
- CN113806574A CN113806574A CN202111009249.5A CN202111009249A CN113806574A CN 113806574 A CN113806574 A CN 113806574A CN 202111009249 A CN202111009249 A CN 202111009249A CN 113806574 A CN113806574 A CN 113806574A
- Authority
- CN
- China
- Prior art keywords
- image
- artificial intelligence
- software
- steps
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 18
- 238000002372 labelling Methods 0.000 claims abstract description 17
- 238000013135 deep learning Methods 0.000 claims description 17
- 238000005457 optimization Methods 0.000 claims description 15
- 238000011478 gradient descent method Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000013499 data model Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000007786 learning performance Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000012800 visualization Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000012545 processing Methods 0.000 abstract description 5
- 238000011161 development Methods 0.000 abstract description 4
- 238000004519 manufacturing process Methods 0.000 abstract description 3
- 238000011160 research Methods 0.000 abstract description 3
- 230000004927 fusion Effects 0.000 abstract description 2
- 230000018109 developmental process Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开的属于人工智能数据搜索与发布方法技术领域,具体为一种软硬件一体化的人工智能图像识别数据处理方法,该软硬件一体化的人工智能图像识别数据处理方法具体包括:步骤一:根据知识库的描述,按照图像标注规则,使用图像标注工具,对图像数据进行标注,接着选择常用的数据增强方法,使用图像增强工具,通过CPU硬件和GPU硬件结合,对图像数据进行增强,通过构建软硬件一体化的数据处理平台系统,帮助用户快速启动和实现人工智能项目,节省普通行业及业务领域中对图像识别技术的学习与应用的时间成本和人力资源成本,实现人工智能与业务的快速融合,可广泛适用于人工智能图像识别科研、教学、实训、开发和生产等领域。
Description
技术领域
本发明涉及人工智能数据搜索与发布方法技术领域,具体为一种软硬件一体化的人工智能图像识别数据处理方法。
背景技术
随着人工智能技术的发展,可以通网络模型识别出图像内容中包含的文本,这些图像识别结果可以应用于图像分类、广告识别等,在通过网络模型对图像进行文本识别的过程中,对于确定出的任意一个可能的文字,所进行处理流程都是一致的,也就是说,待识别文本的数量或待识别的图像数量会直接影响网络模型需要处理的数据量。
现有的基于深度学习模式的图像识别技术应用很复杂,包括图像数据的标注、深度学习框架的搭建、算法模型代码的编辑、算法模型的训练、算法模型的优化、模型冻结和导出、模型部署等,还涉及到多种硬件,包括核心处理单元、GPU、TPU、存储、网络等,用户的学习成本非常高,用户要使用深度学习实现图像识别的难度大。
发明内容
本发明的目的在于提供一种软硬件一体化的人工智能图像识别数据处理方法,以解决上述背景技术中提出的现有的基于深度学习模式的图像识别技术应用很复杂,用户的学习成本非常高,用户要使用深度学习实现图像识别的难度大的问题。
为实现上述目的,本发明提供如下技术方案:一种软硬件一体化的人工智能图像识别数据处理方法,该软硬件一体化的人工智能图像识别数据处理方法具体包括:
步骤一:根据知识库的描述,按照图像标注规则,使用图像标注工具,对图像数据进行标注,接着选择常用的数据增强方法,使用图像增强工具,通过CPU硬件和GPU硬件结合,对图像数据进行增强;
步骤二:根据知识库描述,选择最合适的人工神经网络,使用深度学习网络搭建工具,对训练网络进行模型搭建,具体方法包括:通过计算机对图像进行识别,包括对图像中的目标进行分类,以及对图像中的目标进行查找,使用编程语言,搭建人工神经网络模型;
步骤三:根据知识库描述,使用深度学习训练引擎工具,通过已搭建的数据训练模型,通过GPU对已标注的数据进行算法模型训练;
步骤四:根据知识库描述,选择常用的网络优化方法,使用优化工具对算法模型进行优化;
步骤五:根据知识库描述,把已经训练完成的数据模型部署到模拟应用环境中,通过边缘CPU或TPU完成算法模型与应用的集成。
优选的,所述步骤一的具体方法包括:1)在给定的数据集中去掉噪声图片;2)规范图片文件格式;3)给图片分类;4)统一文件命名;5)规范存储介质;6)设计存储路径;7)标注人脸图像;8)标注人体图像;9)标注手势图像;10)标注道路场景;11)标注目标对象;12)旋转图片;13)拉伸图片;14)平移图片;15)变换图片颜色。
优选的,所述步骤三中具体方法包括:1)请使用深度学习框架;2)设置训练模型参数;3)定义丢失参数;4)确定训练样本;5)确定测试样本;6)定义正负样本;7)使用可视化工具;8)将训练结果可视化;9)分析准确率、召回率,验证算法模型。
优选的,所述步骤四的具体方法包括:1)使用梯度下降法;2)使用随机梯度下降法;3)使用小批量随机梯度下降法;4)使用动量优化法;5)使用自适应梯度下降法;所述步骤四中需要做的工作包括:1)分析深度学习性能;2)使用Timeline工具,配置线程优化性能;3)压缩模型。
优选的,所述步骤五中的具体方法包括:将优化后的算法模型部署上线,在模拟的应用场景中调用图像识别服务,验证数据推理结果。
与现有技术相比,本发明的有益效果是:
通过本方法构建数据处理平台系统,可以一站式完成人工智能图像识别数据标注、数据预处理、深度学习模型构建、模型优化、模型测试和模型部署的一系列步骤,平台系统支持用户完成人工智能图像识别领域里图像分类、目标检测、语义分割和图像生成的基本任务,是一套适用于人工智能图像识别科研、教学、实训、开发和生产的完整体系,通过构建软硬件一体化的数据处理平台系统,帮助用户快速启动和实现人工智能项目,节省普通行业及业务领域中对图像识别技术的学习与应用的时间成本和人力资源成本,实现人工智能与业务的快速融合,可广泛适用于人工智能图像识别科研、教学、实训、开发和生产等领域。
附图说明
图1为本发明系统模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例:
请参阅图1,本发明提供一种技术方案:一种软硬件一体化的人工智能图像识别数据处理方法,该软硬件一体化的人工智能图像识别数据处理方法具体包括:
步骤一:根据知识库的描述,按照图像标注规则,使用图像标注工具,对图像数据进行标注,接着选择常用的数据增强方法,使用图像增强工具,通过CPU硬件和GPU硬件结合,对图像数据进行增强;
步骤二:根据知识库描述,选择最合适的人工神经网络,使用深度学习网络搭建工具,对训练网络进行模型搭建,具体方法包括:通过计算机对图像进行识别,包括对图像中的目标进行分类,以及对图像中的目标进行查找,使用编程语言,搭建人工神经网络模型;
步骤三:根据知识库描述,使用深度学习训练引擎工具,通过已搭建的数据训练模型,通过GPU对已标注的数据进行算法模型训练;
步骤四:根据知识库描述,选择常用的网络优化方法,使用优化工具对算法模型进行优化;
步骤五:根据知识库描述,把已经训练完成的数据模型部署到模拟应用环境中,通过边缘CPU或TPU完成算法模型与应用的集成。
所述步骤一的具体方法包括:1)在给定的数据集中去掉噪声图片;2)规范图片文件格式;3)给图片分类;4)统一文件命名;5)规范存储介质;6)设计存储路径;7)标注人脸图像;8)标注人体图像;9)标注手势图像;10)标注道路场景;11)标注目标对象;12)旋转图片;13)拉伸图片;14)平移图片;15)变换图片颜色。
所述步骤三中具体方法包括:1)请使用深度学习框架;2)设置训练模型参数;3)定义丢失参数;4)确定训练样本;5)确定测试样本;6)定义正负样本;7)使用可视化工具;8)将训练结果可视化;9)分析准确率、召回率,验证算法模型。
所述步骤四的具体方法包括:1)使用梯度下降法;2)使用随机梯度下降法;3)使用小批量随机梯度下降法;4)使用动量优化法;5)使用自适应梯度下降法;所述步骤四中需要做的工作包括:1)分析深度学习性能;2)使用Timeline工具,配置线程优化性能;3)压缩模型。
所述步骤五中的具体方法包括:将优化后的算法模型部署上线,在模拟的应用场景中调用图像识别服务,验证数据推理结果。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明;因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (5)
1.一种软硬件一体化的人工智能图像识别数据处理方法,其特征在于:该软硬件一体化的人工智能图像识别数据处理方法具体包括:
步骤一:根据知识库的描述,按照图像标注规则,使用图像标注工具,对图像数据进行标注,接着选择常用的数据增强方法,使用图像增强工具,通过CPU硬件和GPU硬件结合,对图像数据进行增强;
步骤二:根据知识库描述,选择最合适的人工神经网络,使用深度学习网络搭建工具,对训练网络进行模型搭建,具体方法包括:通过计算机对图像进行识别,包括对图像中的目标进行分类,以及对图像中的目标进行查找,使用编程语言,搭建人工神经网络模型;
步骤三:根据知识库描述,使用深度学习训练引擎工具,通过已搭建的数据训练模型,通过GPU对已标注的数据进行算法模型训练;
步骤四:根据知识库描述,选择常用的网络优化方法,使用优化工具对算法模型进行优化;
步骤五:根据知识库描述,把已经训练完成的数据模型部署到模拟应用环境中,通过边缘CPU或TPU完成算法模型与应用的集成。
2.根据权利要求1所述的一种软硬件一体化的人工智能图像识别数据处理方法,其特征在于:所述步骤一的具体方法包括:1)在给定的数据集中去掉噪声图片;2)规范图片文件格式;3)给图片分类;4)统一文件命名;5)规范存储介质;6)设计存储路径;7)标注人脸图像;8)标注人体图像;9)标注手势图像;10)标注道路场景;11)标注目标对象;12)旋转图片;13)拉伸图片;14)平移图片;15)变换图片颜色。
3.根据权利要求1所述的一种软硬件一体化的人工智能图像识别数据处理方法,其特征在于:所述步骤三中具体方法包括:1)请使用深度学习框架;2)设置训练模型参数;3)定义丢失参数;4)确定训练样本;5)确定测试样本;6)定义正负样本;7)使用可视化工具;8)将训练结果可视化;9)分析准确率、召回率,验证算法模型。
4.根据权利要求1所述的一种软硬件一体化的人工智能图像识别数据处理方法,其特征在于:所述步骤四的具体方法包括:1)使用梯度下降法;2)使用随机梯度下降法;3)使用小批量随机梯度下降法;4)使用动量优化法;5)使用自适应梯度下降法;所述步骤四中需要做的工作包括:1)分析深度学习性能;2)使用Timeline工具,配置线程优化性能;3)压缩模型。
5.根据权利要求1所述的一种软硬件一体化的人工智能图像识别数据处理方法,其特征在于:所述步骤五中的具体方法包括:将优化后的算法模型部署上线,在模拟的应用场景中调用图像识别服务,验证数据推理结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111009249.5A CN113806574A (zh) | 2021-08-31 | 2021-08-31 | 一种软硬件一体化的人工智能图像识别数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111009249.5A CN113806574A (zh) | 2021-08-31 | 2021-08-31 | 一种软硬件一体化的人工智能图像识别数据处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113806574A true CN113806574A (zh) | 2021-12-17 |
Family
ID=78942005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111009249.5A Pending CN113806574A (zh) | 2021-08-31 | 2021-08-31 | 一种软硬件一体化的人工智能图像识别数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113806574A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724009A (zh) * | 2022-04-26 | 2022-07-08 | 北京拙河科技有限公司 | 一种基于改进的深度学习网络的图像识别方法及装置 |
CN114757307A (zh) * | 2022-06-14 | 2022-07-15 | 中国电力科学研究院有限公司 | 一种人工智能自动训练方法、系统、装置及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180121732A1 (en) * | 2016-11-03 | 2018-05-03 | Samsung Electronics Co., Ltd. | Data recognition model construction apparatus and method for constructing data recognition model thereof, and data recognition apparatus and method for recognizing data thereof |
CN112528738A (zh) * | 2020-11-06 | 2021-03-19 | 广东电网有限责任公司中山供电局 | 一种人工智能图像识别模型优化方法及系统 |
-
2021
- 2021-08-31 CN CN202111009249.5A patent/CN113806574A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180121732A1 (en) * | 2016-11-03 | 2018-05-03 | Samsung Electronics Co., Ltd. | Data recognition model construction apparatus and method for constructing data recognition model thereof, and data recognition apparatus and method for recognizing data thereof |
CN112528738A (zh) * | 2020-11-06 | 2021-03-19 | 广东电网有限责任公司中山供电局 | 一种人工智能图像识别模型优化方法及系统 |
Non-Patent Citations (1)
Title |
---|
来晓: ""基于深度学习的果蔬图像识别方法研究"", 《中国优秀硕士学位论文全文数据库农业科技辑》, no. 7, pages 043 - 13 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724009A (zh) * | 2022-04-26 | 2022-07-08 | 北京拙河科技有限公司 | 一种基于改进的深度学习网络的图像识别方法及装置 |
CN114724009B (zh) * | 2022-04-26 | 2022-09-27 | 北京拙河科技有限公司 | 一种基于改进的深度学习网络的图像识别方法及装置 |
CN114757307A (zh) * | 2022-06-14 | 2022-07-15 | 中国电力科学研究院有限公司 | 一种人工智能自动训练方法、系统、装置及存储介质 |
CN114757307B (zh) * | 2022-06-14 | 2022-09-06 | 中国电力科学研究院有限公司 | 一种人工智能自动训练方法、系统、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
JP6894534B2 (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
CN111160569A (zh) | 基于机器学习模型的应用开发方法、装置及电子设备 | |
CN110866093A (zh) | 机器问答方法及装置 | |
CN111339935B (zh) | 一种基于可解释cnn图像分类模型的光学遥感图片分类方法 | |
CN113806574A (zh) | 一种软硬件一体化的人工智能图像识别数据处理方法 | |
CN113870395A (zh) | 动画视频生成方法、装置、设备及存储介质 | |
CN112100401A (zh) | 面向科技服务的知识图谱构建方法、装置、设备及存储介质 | |
Leach | Design in the age of artificial intelligence | |
CN110175657A (zh) | 一种图像多标签标记方法、装置、设备及可读存储介质 | |
Yirtici et al. | Regional-CNN-based enhanced Turkish sign language recognition | |
CN115131698A (zh) | 视频属性确定方法、装置、设备及存储介质 | |
Gupta et al. | Generating image captions using deep learning and natural language processing | |
CN117196042B (zh) | 一种教育元宇宙中学习目标的语义推理方法及终端 | |
CN117033609B (zh) | 文本视觉问答方法、装置、计算机设备和存储介质 | |
KR102269606B1 (ko) | 콜드 스타트를 해결하기 위한 신규 컨텐츠 분석 분석 방법, 장치 및 컴퓨터 프로그램 | |
CN114490993A (zh) | 小样本意图识别方法、系统、设备及存储介质 | |
CN114692649A (zh) | 一种利用多视角信息的自动回答文本生成方法 | |
CN113535946A (zh) | 基于深度学习的文本鉴别方法、装置、设备及存储介质 | |
CN113761109A (zh) | 一种问答库构建方法以及相关装置 | |
CN117689963B (zh) | 一种基于多模态预训练模型的视觉实体链接方法 | |
WO2023166747A1 (ja) | 学習データ生成装置、学習データ生成方法、及びプログラム | |
WO2023166746A1 (ja) | 要約生成装置、要約モデル学習装置、要約生成方法、要約モデル学習方法、及びプログラム | |
Li et al. | Using artificial intelligence assisted learning technology on augmented reality-based manufacture workflow | |
CN117454891A (zh) | 一种基于预训练模型的封闭域信息抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |