CN112418219A - 一种服装面料裁片的颜色和形状识别方法及相关装置 - Google Patents
一种服装面料裁片的颜色和形状识别方法及相关装置 Download PDFInfo
- Publication number
- CN112418219A CN112418219A CN202011332429.2A CN202011332429A CN112418219A CN 112418219 A CN112418219 A CN 112418219A CN 202011332429 A CN202011332429 A CN 202011332429A CN 112418219 A CN112418219 A CN 112418219A
- Authority
- CN
- China
- Prior art keywords
- data set
- network structure
- image
- image data
- shape
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000004744 fabric Substances 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000012360 testing method Methods 0.000 claims abstract description 24
- 239000000463 material Substances 0.000 claims abstract description 20
- 238000011156 evaluation Methods 0.000 claims abstract description 15
- 238000002372 labelling Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 230000008014 freezing Effects 0.000 claims abstract description 9
- 238000007710 freezing Methods 0.000 claims abstract description 9
- 230000002708 enhancing effect Effects 0.000 claims abstract description 7
- 238000005520 cutting process Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 6
- 238000013519 translation Methods 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 239000003086 colorant Substances 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000001057 purple pigment Substances 0.000 description 1
- 235000020095 red wine Nutrition 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种服装面料裁片的颜色和形状识别方法及相关装置,其中方法包括:采集服装面料裁片的图像数据集,通过LabelImg工具对图像数据集进行标注并保存;对图像数据集进行增强得到图像扩充数据集,图像扩充数据集包括:训练集和测试集;设置RetinaNet网络结构模型的特征提取层为ResNet‑50;设置RetinaNet网络结构模型的评价指标,并对RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将训练集输入到RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型;将测试集输入到RetinaNet网络结构识别模型,输出服装面料裁片的识别结果,解决了现有的服装面料裁片识别技术不能同时兼顾快速且准确的识别性能的技术问题。
Description
技术领域
本申请涉及目标检测技术领域,尤其涉及一种服装面料裁片的颜色和形状识别方法及装置。
背景技术
随着我国现代科学技术的飞速发展,传统产业也将受到一定程度的冲击。企业需要尽快融入现代科学技术,向自动化、智能化方向发展。利用计算机视觉领域的研究成果代替人工完成大量重复、程式化的生产过程,可以生产兴业提高生产效率和产品质量提供一种新的解决方案。
在服装产品制作过程中,服装面料裁片的识别是一道非常重要的工序。服装面料片的形状和颜色识别与分类需要大量的人力物力,阻碍了工作质量和分类效率,使产品的生产时间无法得到有效保障。因此,找到一种服装面料裁片的分类方法,不仅可以提高服装生产的生产效率,而且可以减少大量人力物力的消耗,也可以保证服装产品的质量。
目前,服装面料裁片的形状和颜色识别与分类主要有:人工目测法、机器学习法以及深度学习法(如Faster RCNN),虽然深度学习法相较于人工目测法显著的提高了识别速度,相较于机器学习法提高了识别准确率,但是对于服装面料裁片的识别显然过于复杂,使得不能同时兼顾快速且准确的识别性能。
发明内容
本申请实施例提供了一种服装面料裁片的颜色和形状识别方法及相关装置,用于解决现有的服装面料裁片识别技术不能同时兼顾快速且准确的识别性能的技术问题。
有鉴于此,本申请第一方面提供了一种服装面料裁片的颜色和形状识别方法,所述方法包括:
采集服装面料裁片的图像数据集,通过LabelImg工具对所述图像数据集进行标注并保存;
对所述图像数据集进行增强得到图像扩充数据集,所述图像扩充数据集包括:训练集和测试集;
建立RetinaNet网络结构模型,设置所述RetinaNet网络结构模型的特征提取层为ResNet-50;
设置所述RetinaNet网络结构模型的评价指标,并对所述RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将所述训练集输入到所述RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型;
将所述测试集输入到所述RetinaNet网络结构识别模型,输出所述服装面料裁片的识别结果。
可选地,所述采集服装面料裁片的图像数据集,对所述图像数据集进行标注并保存,具体包括:
设置采集背景颜色为白色以及图像大小为1280×960,对所述服装面料裁片的图像数据集进行采集;
通过LabelImg工具对所述图像数据集中的图像形状进行标框后,保存所述图像数据集为XML文件。
可选地,所述对所述图像数据集进行增强得到图像扩充数据集,具体包括:
对所述图像数据集进行数据增强处理得到图像扩充数据集,所述数据增强处理包括:旋转、缩放、翻转、随机区域采集、平移。
可选地,所述评价指标包括:交并比、准确率、mAP、FPS。
可选地,所述采集服装面料裁片的图像数据集,之后还包括:
根据所述对图像数据集中图像的颜色和形状,对所述图像数据集的每张图像进行命名。
本申请第二方面提供一种服装面料裁片的颜色和形状识别装置,所述装置包括:
采集单元,用于采集服装面料裁片的图像数据集,通过LabelImg工具对所述图像数据集进行标注并保存;
扩充单元,用于对所述图像数据集进行增强得到图像扩充数据集,所述图像扩充数据集包括:训练集和测试集;
建模单元,用于建立RetinaNet网络结构模型,设置所述RetinaNet网络结构模型的特征提取层为ResNet-50;
训练单元,用于设置所述RetinaNet网络结构模型的评价指标,并对所述RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将所述训练集输入到所述RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型;
识别单元,用于将所述测试集输入到所述RetinaNet网络结构识别模型,输出所述服装面料裁片的识别结果。
可选地,所述采集单元,具体用于:
设置采集背景颜色为白色以及图像大小为1280×960,对所述服装面料裁片的图像数据集进行采集;
通过LabelImg工具对所述图像数据集中的图像形状进行标框后,保存所述图像数据集为XML文件。
可选地,所述扩充单元,具体用于:
对所述图像数据集进行数据增强处理得到图像扩充数据集,所述数据增强处理包括:旋转、缩放、翻转、随机区域采集、平移。
本申请第三方面提供一种服装面料裁片的颜色和形状识别设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的服装面料裁片的颜色和形状识别方法的步骤。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的服装面料裁片的颜色和形状识别方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,提供了一种服装面料裁片的颜色和形状识别方法,包括:采集服装面料裁片的图像数据集,通过LabelImg工具对图像数据集进行标注并保存;对图像数据集进行增强得到图像扩充数据集,图像扩充数据集包括:训练集和测试集;建立RetinaNet网络结构模型,设置RetinaNet网络结构模型的特征提取层为ResNet-50;设置RetinaNet网络结构模型的评价指标,并对RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将训练集输入到RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型;将测试集输入到RetinaNet网络结构识别模型,输出服装面料裁片的识别结果。
本申请的服装面料裁片的颜色和形状识别方法,首先通过LabelImg工具对所述图像数据集进行标注并保存;接着通过对图像数据集进行扩充,提高了对网络模型的训练效果;然后利用RetinaNet网络模型的能够很好的捕获边缘一类的低级特征,因此不需要对识别任务进行微调,提高了识别的速度;同时在训练过程中对训练网络中的第一个和第二个卷积层进行冻结,这样在提高训练速度的同时可以获得更好的识别效果,提高了识别的准确率,解决了现有的服装面料裁片识别技术不能同时兼顾快速且准确的识别性能的技术问题。
附图说明
图1为本申请实施例中提供的一种服装面料裁片的颜色和形状识别方法的实施例一的流程示意图;
图2为本申请实施例中提供的一种服装面料裁片的颜色和形状识别方法的实施例二的流程示意图;
图3为本申请实施例中提供的一种服装面料裁片的颜色和形状识别装置的实施例的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,本申请实施例提供的一种服装面料裁片的颜色和形状识别方法的实施例一,包括:
步骤101、采集服装面料裁片的图像数据集,通过LabelImg工具对图像数据集进行标注并保存。
需要说明的是,本领域技术人员可以通过采用相机成像系统采集服装面料裁片图像来作为服装面料裁片的图像数据集;并通过LabelImg工具对图像数据集进行标注并保存。标注的包括:服装面料裁片形状和颜色,形状主要包括:服装面料裁片的前幅、后幅、袖头、袖子和裤腿五类;颜色主要是包括黑色、白色、红色、橙色、黄色、蓝色、绿色、紫色。对于图像的采集以及标注,本领域技术人员可以根据实际情况进行选取,在此不做限定。
步骤102、对图像数据集进行增强得到图像扩充数据集,图像扩充数据集包括:训练集和测试集。
可以理解的是,为了能够可以得到更好的训练效果,本实施例对图像数据集进行增强,也就是将同一张图像进行不同的处理得到不同效果的多张图像,从而扩大了图像数据集得到图像扩充数据集。其中训练集用于对网络模型进行训练,测试集用于对训练好的网络模型进行测试。
步骤103、建立RetinaNet网络结构模型,设置RetinaNet网络结构模型的特征提取层为ResNet-50。
需要说明的是,因为ResNet-50能够很好的捕获边缘一类的低级特征,而不需要对识别任务进行微调,能够很好地提高识别速度,因此本实施例设置RetinaNet网络结构模型的特征提取层为ResNet-50。
并且本实施例将RetinaNet网络结构模型的参数batch大小设置为4,采用的优化器为Momentum Optimizer,学习率设为0.001,momentum的值设置为0.9,迭代次数为10000次。参数设定中,非极大值抑制交并比阈值设为0.5,置信度阈值设为0.05,对于网络结果模型参数的设定,本领域技术人员可以根据实际情况进行选择,对此不作限定。
步骤104、设置RetinaNet网络结构模型的评价指标,并对RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将训练集输入到RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型。
需要说明的是,评价指标用于确定RetinaNet网络结构模型的识别性能,因此可以根据实际需要进行设置。申请人通过实验得到,在训练过程中对训练网络中的第一个和第二个卷积层进行冻结,这样在提高训练速度的同时可以获得更好的识别效果,因此本实施例对RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结,从而提高了模型的识别准确率。
步骤105、将测试集输入到RetinaNet网络结构识别模型,输出服装面料裁片的识别结果。
最后,将测试集输入到训练好的模型中,得到服装面料裁片的识别结果。
本申请实施例一的服装面料裁片的颜色和形状识别方法,首先通过LabelImg工具对图像数据集进行标注并保存;接着通过对图像数据集进行扩充,提高了对网络模型的训练效果;然后利用RetinaNet网络模型的能够很好的捕获边缘一类的低级特征,因此不需要对识别任务进行微调,提高了识别的速度,同时在训练过程中对训练网络中的第一个和第二个卷积层进行冻结,这样在提高训练速度的同时可以获得更好的识别效果,从而提高了识别的准确率,解决了现有的服装面料裁片识别技术不能同时兼顾快速且准确的识别性能的技术问题。
以上为本申请提供的一种服装面料裁片的颜色和形状识别方法的实施例一,以上为本申请提供的一种服装面料裁片的颜色和形状识别方法的实施例二。
请参阅图2,本申请实施例提供的一种服装面料裁片的颜色和形状识别方法的实施例二,包括:
步骤201、设置采集背景颜色为白色以及图像大小为1280×960,对服装面料裁片的图像数据集进行采集。
需要说明的是,为了能够减少服装面料裁片的数据集对识别速度以及准确性的干扰,本实施例在采集服装面料裁片的图像数据集时,将采集背景颜色为白色,并且设置图像大小为1280×960。
步骤202、根据对图像数据集中图像的颜色和形状,对图像数据集的每张图像进行命名。
需要说明的是,为了方便对识别出来的服装面料裁片进行分类,本实施例还图像数据集的每张图像进行命名,对于命名的方式,可以通过人工命名的或者其他的命名方式,在此不做限定。
步骤203、通过LabelImg工具对图像数据集中的图像形状进行标框后,保存图像数据集为XML文件。
需要说明的是,本实施例通过LabelImg工具对图像数据集中的图像形状进行标框并保存,其中图像框设置为长方形;生成的XML文件中保存着图像裁片的颜色形状信息和标注的长方形图像框的位置信息。
步骤204、对图像数据集进行数据增强处理得到图像扩充数据集,数据增强处理包括:旋转、缩放、翻转、随机区域采集、平移;图像扩充数据集包括:训练集和测试集。
本实施例通过旋转、缩放、翻转、随机区域采集、平移等对图像数据集进行数据增强处理,本领域技术人员可以根据实际需要进行选取,在此不做限定。
步骤205、建立RetinaNet网络结构模型,设置RetinaNet网络结构模型的特征提取层为ResNet-50。
步骤205与实施例一步骤103描述相同,请参见步骤103描述,在此不再赘述。
步骤206、设置RetinaNet网络结构模型的评价指标,并对RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将训练集输入到RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型,评价指标包括:交并比、准确率、mAP、FPS。
需要说明的是,预置训练次数根据实际情况进行设定;考虑到同时兼顾对服装面料裁片识别的速度和准确率,本实施例将RetinaNet网络结构模型的评价指标设置为:交并比、准确率、mAP、FPS。
步骤207、将测试集输入到RetinaNet网络结构识别模型,输出服装面料裁片的识别结果。
最后,将测试集输入到训练好的模型中,得到服装面料裁片的识别结果。
以下为基于本申请实施例的服装面料裁片的颜色和形状识别方法的实验结果:
表2为不同服装面料裁片形状在该网络的测试结果;表3为不同服装面料裁片颜色在该网络的测试结果;表4为RetinaNet网络结构识别模型的mAP与FPS性能表。
前幅 | 后幅 | 袖子 | 袖头 | 裤腿 | |
准确率 | 89.85% | 90.49% | 96.69% | 97.42% | 98.22% |
表2
黑 | 白 | 红 | 橙 | 黄 | 绿 | 蓝 | 紫 | |
准确率 | 98.4% | 91.9% | 97.1% | 90.4% | 92.2% | 99.2% | 98.1% | 96.4% |
表3
mAP | FPS(帧/秒) |
85.56% | 9 |
表4
通过实验结果表明,本申请的服装面料裁片的识别方法对服装面料裁片颜色和形状识别的准确率较高,该方法的MAP值为85.56%,FPS值为9,能够同时满足对服装面料裁片实时识别的速度和准确率要求。
以上为本申请提供的一种服装面料裁片的颜色和形状识别方法的实施例二,以上为本申请提供的一种服装面料裁片的颜色和形状识别装置的实施例。
请参阅图3,本申请提供的一种服装面料裁片的颜色和形状识别装置的实施例,包括:
采集单元301,用于采集服装面料裁片的图像数据集,通过LabelImg工具对图像数据集进行标注并保存;
扩充单元302,用于对图像数据集进行增强得到图像扩充数据集,图像扩充数据集包括:训练集和测试集;
建模单元303,用于建立RetinaNet网络结构模型,设置RetinaNet网络结构模型的特征提取层为ResNet-50;
训练单元304,用于设置RetinaNet网络结构模型的评价指标,并对RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将训练集输入到RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型;
识别单元305,用于将测试集输入到RetinaNet网络结构识别模型,输出服装面料裁片的识别结果。
进一步地,本申请还提供了一种服装面料裁片的颜色和形状识别设备,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行上述方法实施例中任一种服装面料裁片的颜色和形状识别方法。
进一步地,本申请还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述方法实施例中任一种服装面料裁片的颜色和形状识别方法。
属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种服装面料裁片的颜色和形状识别方法,其特征在于,包括:
采集服装面料裁片的图像数据集,通过LabelImg工具对所述图像数据集进行标注并保存;
对所述图像数据集进行增强得到图像扩充数据集,所述图像扩充数据集包括:训练集和测试集;
建立RetinaNet网络结构模型,设置所述RetinaNet网络结构模型的特征提取层为ResNet-50;
设置所述RetinaNet网络结构模型的评价指标,并对所述RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将所述训练集输入到所述RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型;
将所述测试集输入到所述RetinaNet网络结构识别模型,输出所述服装面料裁片的识别结果。
2.根据权利要求1所述的服装面料裁片的颜色和形状识别方法,其特征在于,所述采集服装面料裁片的图像数据集,对所述图像数据集进行标注并保存,具体包括:
设置采集背景颜色为白色以及图像大小为1280×960,对所述服装面料裁片的图像数据集进行采集;
通过LabelImg工具对所述图像数据集中的图像形状进行标框后,保存所述图像数据集为XML文件。
3.根据权利要求1所述的服装面料裁片的颜色和形状识别方法,其特征在于,所述对所述图像数据集进行增强得到图像扩充数据集,具体包括:
对所述图像数据集进行数据增强处理得到图像扩充数据集,所述数据增强处理包括:旋转、缩放、翻转、随机区域采集、平移。
4.根据权利要求1所述的服装面料裁片的颜色和形状识别方法,其特征在于,所述评价指标包括:交并比、准确率、mAP、FPS。
5.根据权利要求1所述的服装面料裁片的颜色和形状识别方法,其特征在于,所述采集服装面料裁片的图像数据集,之后还包括:
根据所述对图像数据集中图像的颜色和形状,对所述图像数据集的每张图像进行命名。
6.一种服装面料裁片的颜色和形状识别装置,其特征在于,包括:
采集单元,用于采集服装面料裁片的图像数据集,通过LabelImg工具对所述图像数据集进行标注并保存;
扩充单元,用于对所述图像数据集进行增强得到图像扩充数据集,所述图像扩充数据集包括:训练集和测试集;
建模单元,用于建立RetinaNet网络结构模型,设置所述RetinaNet网络结构模型的特征提取层为ResNet-50;
训练单元,用于设置所述RetinaNet网络结构模型的评价指标,并对所述RetinaNet网络结构模型的第一个卷积层和第二个卷积层均进行冻结后,将所述训练集输入到所述RetinaNet网络结构模型进行训练,当达到预置训练次数时,得到RetinaNet网络结构识别模型;
识别单元,用于将所述测试集输入到所述RetinaNet网络结构识别模型,输出所述服装面料裁片的识别结果。
7.根据权利要求6所述的服装面料裁片的颜色和形状识别装置,其特征在于,所述采集单元,具体用于:
设置采集背景颜色为白色以及图像大小为1280×960,对所述服装面料裁片的图像数据集进行采集;
通过LabelImg工具对所述图像数据集中的图像形状进行标框后,保存所述图像数据集为XML文件。
8.根据权利要求6所述的服装面料裁片的颜色和形状识别装置,其特征在于,所述扩充单元,具体用于:
对所述图像数据集进行数据增强处理得到图像扩充数据集,所述数据增强处理包括:旋转、缩放、翻转、随机区域采集、平移。
9.一种服装面料裁片的颜色和形状识别设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-5任一项所述的服装面料裁片的颜色和形状识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-5任一项所述的服装面料裁片的颜色和形状识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011332429.2A CN112418219A (zh) | 2020-11-24 | 2020-11-24 | 一种服装面料裁片的颜色和形状识别方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011332429.2A CN112418219A (zh) | 2020-11-24 | 2020-11-24 | 一种服装面料裁片的颜色和形状识别方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112418219A true CN112418219A (zh) | 2021-02-26 |
Family
ID=74777402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011332429.2A Pending CN112418219A (zh) | 2020-11-24 | 2020-11-24 | 一种服装面料裁片的颜色和形状识别方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112418219A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778701A (zh) * | 2017-01-20 | 2017-05-31 | 福州大学 | 一种加入Dropout的卷积神经网络的果蔬图像识别方法 |
CN109684906A (zh) * | 2018-05-31 | 2019-04-26 | 北京林业大学 | 基于深度学习的检测红脂大小蠹的方法 |
CN111126251A (zh) * | 2019-12-20 | 2020-05-08 | 深圳市商汤科技有限公司 | 图像处理方法、装置、设备和存储介质 |
CN111401419A (zh) * | 2020-03-05 | 2020-07-10 | 浙江理工大学桐乡研究院有限公司 | 基于改进RetinaNet的员工着装规范检测方法 |
CN111611972A (zh) * | 2020-06-01 | 2020-09-01 | 南京信息工程大学 | 基于多视图多任务集成学习的作物叶片种类识别方法 |
-
2020
- 2020-11-24 CN CN202011332429.2A patent/CN112418219A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778701A (zh) * | 2017-01-20 | 2017-05-31 | 福州大学 | 一种加入Dropout的卷积神经网络的果蔬图像识别方法 |
CN109684906A (zh) * | 2018-05-31 | 2019-04-26 | 北京林业大学 | 基于深度学习的检测红脂大小蠹的方法 |
CN111126251A (zh) * | 2019-12-20 | 2020-05-08 | 深圳市商汤科技有限公司 | 图像处理方法、装置、设备和存储介质 |
CN111401419A (zh) * | 2020-03-05 | 2020-07-10 | 浙江理工大学桐乡研究院有限公司 | 基于改进RetinaNet的员工着装规范检测方法 |
CN111611972A (zh) * | 2020-06-01 | 2020-09-01 | 南京信息工程大学 | 基于多视图多任务集成学习的作物叶片种类识别方法 |
Non-Patent Citations (1)
Title |
---|
王智文: "《人脸检测与识别研究》", 西南交通大学出版社, pages: 96 - 102 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108562589B (zh) | 一种对磁路材料表面缺陷进行检测的方法 | |
CN106446933B (zh) | 基于上下文信息的多目标检测方法 | |
CN108846401A (zh) | 商品检测终端、方法、系统以及计算机设备、可读介质 | |
JP2022510712A (ja) | ニューラルネットワークの訓練方法及び画像マッチング方法、並びに装置 | |
CN104636759B (zh) | 一种获取图片推荐滤镜信息的方法及图片滤镜信息推荐系统 | |
CN108647625A (zh) | 一种表情识别方法及装置 | |
CN107066972B (zh) | 基于多通道极值区域的自然场景文本检测方法 | |
CN109948625A (zh) | 文本图像清晰度评估方法及系统、计算机可读存储介质 | |
CN108009560B (zh) | 商品图像相似类别判定方法及装置 | |
CN111061898A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN103440035A (zh) | 一种三维空间中的手势识别系统及其识别方法 | |
CN105718552A (zh) | 基于服装手绘草图的服装图像检索方法 | |
CN111414948B (zh) | 目标对象检测方法和相关装置 | |
CN109409377A (zh) | 图像中文字的检测方法及装置 | |
CN109857878B (zh) | 物品标注方法及装置、电子设备及存储介质 | |
CN116310548A (zh) | 一种进口种子产品中的入侵植物种子检测方法 | |
CN108961250A (zh) | 一种目标物统计方法、装置、终端以及存储介质 | |
CN111161295A (zh) | 一种菜品图像背景剥离方法 | |
Fang et al. | cTADA: the design of a crowdsourcing tool for online food image identification and segmentation | |
CN105404682B (zh) | 一种基于数字图像内容的图书检索方法 | |
CN103886319A (zh) | 一种基于机器视觉的举牌智能识别方法 | |
Kartika et al. | Butterfly image classification using color quantization method on hsv color space and local binary pattern | |
CN111598090B (zh) | 印刷电路板上标记的识别方法、装置、设备及存储介质 | |
CN102968618A (zh) | 一种融合BoF模型和谱聚类算法的静态手势识别方法 | |
CN112966698A (zh) | 基于轻量化卷积网络的淡水鱼图像实时识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |