CN110738230A - 一种基于f-cdssd的衣物识别与分类方法 - Google Patents
一种基于f-cdssd的衣物识别与分类方法 Download PDFInfo
- Publication number
- CN110738230A CN110738230A CN201910303272.1A CN201910303272A CN110738230A CN 110738230 A CN110738230 A CN 110738230A CN 201910303272 A CN201910303272 A CN 201910303272A CN 110738230 A CN110738230 A CN 110738230A
- Authority
- CN
- China
- Prior art keywords
- classification
- identification
- neural network
- clothes
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提出了一种基于F‑CDSSD的轻量级衣物识别分类方法,包括如下内容:采用数据增强技术,解决训练数据集过小的问题,避免过拟合现象;将传统的VGG‑16网络进行替换为ShuffleNet并且对各个卷积层输出的特征图进行模糊处理,降低了网络结构的复杂度,使之可以在轻型计算平台上运行;调整default box的大小、纵横比和数量,提高了神经网络的精度和效率;针对不清晰的图像引入模糊理论,提高了对低质量衣物图像的识别精度;实现了主动学习和迭代学习,充分利用模型检测结果,实现了神经网络模型的不断优化。
Description
技术领域
本发明涉及物联网、基于深度学习的衣物识别与分类、主动学习、模糊理论、并发执行和缓存技术,具体涉及到一种基于F-CDSSD的衣物识别与分类方法。
背景技术
近几年,深度学习得到了飞速的发展,把目标检测和分类推到了一个新的高度。卷积神经网络对于目标的几何变换、形变、光照等因素适应性较强,有效克服了由于衣物外观多变带来的识别阻力。它可根据输入到网络的数据自动地生成相应特征的描述,具有较高的灵活性和普适性。目前图像中的目标检测主要分为single-stage方法(如SSD,YOLO)和two-stage方法(如RCNN系列)两种。Single-stage方法直接在图片上经过计算生成检测结果。Two-stage方法先在图像上提取候选区域,再基于候选区域进行特征提取然后再进行预测。相对来说single-stage速度快,精度低,而two-stage精度高,速度慢。
YOLO作为深度学习中利用single-stage方法进行目标检测的先驱,首次提出了直接将目标检测转化为回归问题,用整张图片得到边界框和目标类别的思路。以YOLO为主体并加以改进提出的SSD增加了对多尺度目标的检测,很大程度上解决了YOLO难以检测小目标、定位不准等问题。但是SSD算法中存在过多比例不合适的default box,这样在后续的回归中会造成很大的计算量的浪费;SSD中传统的VGG-16网络结构所得到的神经网络对于轻型ARM计算平台而言,结构过于庞大,难以在轻型计算设备上运行;同时对于相对模糊的图像识别效果较差。
本方法采用基于F-CDSSD的轻型衣物识别与分类方法,通过数据增强技术对训练数据集进行扩充,解决训练集过小的问题;将主体神经网络替换为轻型的ShuffleNet,使之能够在轻量级计算平台上平稳运行;在模型训练过程中将default boxes根据图像中衣物的特点进行调整,加快模型训练速度,提升模型的准确型;将得到的视频数据加上基于一系列的语言规则(IF-THEN)或选择合适的成员函数(三角函数、梯形函数、高斯函数等)模糊预处理操作,从而生成模糊输入集,将视频数据输入神经网络,经得到特征图模糊化,然后再做衣物类别判断和边框回归;此外,引入了主动学习和迭代学习的思想,将检测到的图像以及生成的标注经过校验之后加入到神经网络的优化中,对于新的衣物可以保证有较高的准确率。
发明内容
为解决现有技术中的缺点和不足,本发明提出了一种新的衣物检测方法。首先对采集到的图像进行数据增强处理,将训练数据集进行扩充;在网络主体结构上,将传统的VGG-16网络结构替换为一种更为轻型的卷积神经网络,最大程度上降低神经网络的复杂度,得到一种新的神经网络F-CDSSD;在训练时,对初始default boxes的尺寸和纵横比进行了调整,提升了对于衣物识别的准确率和速度;引入模糊理论,解决图像不清晰时准确率偏低的问题;采用主动学习和迭代学习的思想,实现神经网络模型的自优化。
本发明的技术方案为:
步骤(1)、采集衣物的图像数据,在将图像进行筛选和人工标注后通过数据增强技术扩充数据量,并部分图像进行模糊处理制作用于训练神经网络模型的数据集;
步骤(2)、修改defaultboxes的纵横比和大小,将主体神经网络更换后进行神经网络的训练,并对得到的特征图进行模糊化处理,得到衣物识别分类神经网络模型F-CDSSD;
步骤(3)、将训练得到的神经网络模型移植到TX2等轻型计算平台上,并与摄像头等图像采集设备对接;
步骤(4)、摄像头实时开启,视频流被切分为多帧图像存入图像解析队列,在采集图像的同时并发进行图像的解析,按照平台的计算能力选择每隔几帧选择一帧输入到衣物识别分类神经网络当中,将其识别结果以字符串的形式返回,同时,将识别结果连同图像通过平台存入返回服务器;
步骤(5)、将缓存服务器中识别错误的图像进行校正作为神经网络模型更新的优化数据集,当识别错误的图像积累到一定数量之后对神经网络模型进行迭代更新。
本发明的有益效果:
(1)本方法通过数据增强技术扩充了训练数据集,解决了神经网络训练小数据集的问题;
(2)本方法针对图像中衣物的特点对训练中default boxes的大小和纵横比进行了调整,提高了神经网络的训练速度和识别精度;
(3)采用一种轻型的卷积神经网络,设计出一种新的衣物检测模型F-CDSSD,在不降低识别精度的基础上提高了识别速度,降低了计算量,使之能够在轻量级计算平台上平稳运行;
(4)引入模糊理论,解决图像不清晰时准确率低下的问题;
(5)采用主动学习和迭代学习的思想,实现了深度学习神经网络的不断优化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本方法完整的体系结构图;图2为本发明基于F-CDSSD的衣物识别主体网络结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本基于F-CDSSD的衣物识别分类框架的流程如主要包含四个部分:数据采集模块、目标识别分类模块、检测结果缓存模块和模型优化模块。
下面,对基于F-CDSSD的衣物识别分框架的具体流程进行详细说明:
步骤(1)、数据采集模块实时开启,将采集到的视频流切分为多帧图像存入图像解析队列,按照平台的计算能力选择每隔几帧选择一帧输入到框架中;
步骤(2)、图像在衣物识别分类框架中经过调整大小、特征提取和分类及坐标回归(如图2)后,返回识别结果;
步骤(3)、将识别结果跟原图像数据进行匹配后存入缓存服务器,数据采集、图像解析、数据缓存并发进行,最大程度上利用计算资源;
步骤(4)、当缓存服务器中的数据积累到一定数量,对由衣物识别分类框架产生的解析文件进行校验和完善,加入到对原有模型的改进之中,实现对神经网络模型的迭代优化。
本发明的基于F-CDSSD的衣物识别分类框架,通过将数据增强、模糊理论、轻型神经网络、主动学习和迭代学习相结合,实现了轻型计算平台上衣物图像的识别与分类;解决了低分辨率和低图像质量下识别准确率低的问题,提升了检测速度和精度;充分利用框架对图像的检测结果,实现了神经网络模型的自优化。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.本基于F-CDSSD的衣物识别分类框架的流程如主要包含四个部分:数据采集模块、目标识别分类模块、检测结果缓存模块和模型优化模块。包括以下步骤:
步骤(1)、数据采集模块实时开启,将采集到的视频流切分为多帧图像存入图像解析队列,按照平台的计算能力选择每隔几帧选择一帧输入到框架中;
步骤(2)、图像在衣物识别分类框架中经过调整大小、特征提取和分类及坐标回归后,返回识别结果;
步骤(3)、将识别结果跟原图像数据进行匹配后存入缓存服务器,数据采集、图像解析、数据缓存并发进行,最大程度上利用计算资源;
步骤(4)、当缓存服务器中的数据积累到一定数量,对由衣物识别分类框架产生的解析文件进行校验和完善,加入到对原有模型的改进之中,实现对神经网络模型的迭代优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910303272.1A CN110738230A (zh) | 2019-04-15 | 2019-04-15 | 一种基于f-cdssd的衣物识别与分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910303272.1A CN110738230A (zh) | 2019-04-15 | 2019-04-15 | 一种基于f-cdssd的衣物识别与分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110738230A true CN110738230A (zh) | 2020-01-31 |
Family
ID=69236648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910303272.1A Pending CN110738230A (zh) | 2019-04-15 | 2019-04-15 | 一种基于f-cdssd的衣物识别与分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110738230A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723657A (zh) * | 2020-05-12 | 2020-09-29 | 中国电子系统技术有限公司 | 一种基于YOLOv3与自优化的河道异物检测方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132396A1 (en) * | 2014-01-17 | 2016-05-12 | Netapp, Inc. | Extent metadata update logging and checkpointing |
CN107403166A (zh) * | 2017-08-02 | 2017-11-28 | 广东工业大学 | 一种提取人脸图像毛孔特征的方法与装置 |
CN107862696A (zh) * | 2017-10-26 | 2018-03-30 | 武汉大学 | 基于时尚图迁移的特定行人衣物解析方法及系统 |
CN107918780A (zh) * | 2017-09-01 | 2018-04-17 | 中山大学 | 一种基于关键点检测的衣服种类和属性分类方法 |
CN109087294A (zh) * | 2018-07-31 | 2018-12-25 | 深圳辰视智能科技有限公司 | 一种产品缺陷检测方法、系统及计算机可读存储介质 |
-
2019
- 2019-04-15 CN CN201910303272.1A patent/CN110738230A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132396A1 (en) * | 2014-01-17 | 2016-05-12 | Netapp, Inc. | Extent metadata update logging and checkpointing |
CN107403166A (zh) * | 2017-08-02 | 2017-11-28 | 广东工业大学 | 一种提取人脸图像毛孔特征的方法与装置 |
CN107918780A (zh) * | 2017-09-01 | 2018-04-17 | 中山大学 | 一种基于关键点检测的衣服种类和属性分类方法 |
CN107862696A (zh) * | 2017-10-26 | 2018-03-30 | 武汉大学 | 基于时尚图迁移的特定行人衣物解析方法及系统 |
CN109087294A (zh) * | 2018-07-31 | 2018-12-25 | 深圳辰视智能科技有限公司 | 一种产品缺陷检测方法、系统及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
AIBAIKE: ""深度学习:shufflenet"", 《HTTPS://BLOG.CSDN.NET/LUFANGBO/ARTICLE/81748015》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723657A (zh) * | 2020-05-12 | 2020-09-29 | 中国电子系统技术有限公司 | 一种基于YOLOv3与自优化的河道异物检测方法及装置 |
CN111723657B (zh) * | 2020-05-12 | 2023-04-07 | 中国电子系统技术有限公司 | 一种基于YOLOv3与自优化的河道异物检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126472B (zh) | 一种基于ssd改进的目标检测方法 | |
CN109741332B (zh) | 一种人机协同的图像分割与标注方法 | |
CN109241982B (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
CN107368845B (zh) | 一种基于优化候选区域的Faster R-CNN目标检测方法 | |
Zhao et al. | Document image binarization with cascaded generators of conditional generative adversarial networks | |
US20190130232A1 (en) | Font identification from imagery | |
CN112418330A (zh) | 一种基于改进型ssd的小目标物体高精度检测方法 | |
CN111488925B (zh) | 一种数据标注方法、装置、电子设备及存储介质 | |
CN113033537A (zh) | 用于训练模型的方法、装置、设备、介质和程序产品 | |
CN112528845B (zh) | 一种基于深度学习的物理电路图识别方法及其应用 | |
WO2023284465A1 (zh) | 图像检测方法、装置、计算机可读存储介质及计算机设备 | |
CN114067173A (zh) | 基于多清晰度集成自训练的小样本低质量图像目标检测方法 | |
CN113361645B (zh) | 基于元学习及知识记忆的目标检测模型构建方法及系统 | |
CN110705412A (zh) | 一种基于运动历史图像的视频目标检测方法 | |
CN109685065A (zh) | 试卷内容自动分类的版面分析方法、系统 | |
CN113076992A (zh) | 一种生活垃圾检测方法及装置 | |
CN112613428B (zh) | 基于平衡损失的Resnet-3D卷积牛视频目标检测方法 | |
CN113569881A (zh) | 一种基于链式残差与注意力机制的自适应语义分割方法 | |
CN110852199A (zh) | 一种基于双帧编码解码模型的前景提取方法 | |
CN113469287A (zh) | 一种基于实例分割网络的航天器多局部构件检测方法 | |
CN114580517A (zh) | 一种图像识别模型的确定方法及装置 | |
CN114882315B (zh) | 样本生成方法、模型训练方法、装置、设备及介质 | |
CN114359167B (zh) | 一种复杂场景下基于轻量化YOLOv4的绝缘子缺陷检测方法 | |
CN116258990A (zh) | 一种基于跨模态亲和力的小样本参考视频目标分割方法 | |
CN116681961A (zh) | 基于半监督方法和噪声处理的弱监督目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200131 |
|
WD01 | Invention patent application deemed withdrawn after publication |