CN115082652A - 一种基于可控光源采集装置的面料成分识别系统 - Google Patents
一种基于可控光源采集装置的面料成分识别系统 Download PDFInfo
- Publication number
- CN115082652A CN115082652A CN202210651620.6A CN202210651620A CN115082652A CN 115082652 A CN115082652 A CN 115082652A CN 202210651620 A CN202210651620 A CN 202210651620A CN 115082652 A CN115082652 A CN 115082652A
- Authority
- CN
- China
- Prior art keywords
- fabric
- image
- light source
- controllable light
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/141—Control of illumination
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于可控光源采集装置的面料成分识别系统。包括图像采集模块、数据预处理模块和面料识别模块。其中图像采集模块通过微型摄像机采集不同成分的面料图像。数据预处理模块用于对采集的图像进行去噪和边缘增强。面料识别模块通过训练后的混合注意力模型,提取不同层次的图像特征,然后运用多层注意力机制抑制无用特征,增强有用特征,最后输出最能反映输入图像的特征向量,与模板库中存储的各种面料图像的特征向量进行比对,选取特征向量最接近的标签,作为当前面料图像的成分识别结果。本系统有效地解决了图像采集的各种环境光干扰因素,实现了对面料细节部分的细节保留和增强,并且提高了面料成分检测的预测成功率和准确率。
Description
技术领域
本发明属于图像采集与处理技术领域,涉及一种基于可控光源采集装置的面料成分识别系统。
背景技术
现有技术对面料成分进行检测的方案主要有两种:第一种是通过专业的面料匹配员对成分进行判断。第二种是通过手机拍照的方式,通过图像颜色匹配的方式,对面料成分进行检测。这两种方案都存在较大的缺陷:专业的面料匹配员通常依据自身的专业知识和经验对面料进行识别,不仅对人员的技术水平要求相对较高,并且识别效率相对较低。手机拍照的方式会受到外界环境光的影响,并且受限于摄像头的硬件条件,难以捕捉面料的细节特征,在匹配的过程中仅依据颜色匹配,最终匹配的准确率不高,并不能达到准确匹配面料的目的。
将基于神经网络模型训练的图像识别技术应用到面料成分识别中,可以帮助面料经销商、设计师以及面料供应商等进行准确的面料识别,为解决线下面料交易市场的交易环节多、交易效率低、交易周期长提供了一种可靠的解决方案。与传统像素级的图像描述分析方法相比,深度学习能够挖掘更多的深度信息进行分类。神经网络模型对浅层的局部信息进行相应的卷积操作能够获取图像中全局的深度信息。
常见的卷积神经网络模型能够对面料的图案、材质、工艺等进行识别,但是其识别精度低、识别时间长、识别准确率不高,想要将其真正地应用于市场,还需要进行进一步的效率与准确率的提升。此外,也亟需一种性能稳定的图片采集装置,对面料的细微物理属性进行采集,配合识别模型工作。
发明内容
针对现有技术的不足,本发明提出了一种基于可控光源采集装置的面料成分识别系统,通过微型摄像头在可控光源下进行面料图像采集,再运用基于神经网络的识别模型,快速、准确地完成面料成分的识别。
一种基于可控光源采集装置的面料成分识别系统,包括图像采集模块、数据预处理模块和面料识别模块。
所述图像采集模块包括不透光的外壳、微型摄像机和可控光源;外壳的底部设有开口,微型摄像机和可控光源固定在外壳内部;微型摄像机的拍摄方向对准外壳底部的开口;可控光源用于提供不同强度的光照。将密封箱的底部紧密、平稳得放置在待识别面料的表面,拍摄待识别面料图像后,传输给数据预处理模块。
作为优选,所述微型摄像头与外壳底部开口间的距离可以调节。
所述数据预处理模块对面料图像进行噪声滤除和数据增强处理后,调整至统一大小后进行归一化操作,以张量的形式将处理后的面料图像信息传输给面料识别模块。
作为优选,所述数据预处理模块通过超采样技术和基于快速双边滤波算法的细节增强技术进行图像去噪和数据增强。
所述面料识别模块通过训练后的混合注意力识别模型对处理后的面料图像信息进行识别,输出面料成分标签。所述混合注意力识别模型包括混合注意力层、多头注意力层、归一化操作和MLP分类器。所述混合注意力层包括3个阶段,每个阶段先通过卷积特征提取器生成特征向量,然后再通过多个卷积交换器得到查询矩阵、键矩阵和值矩阵,其中阶段一的输入为面料图像信息,其他阶段的输入为上一阶段输出的特征向量展开后的特征图。多头注意力层接收混合注意力层3个阶段输出的查询矩阵、键矩阵和值矩阵,进行矩阵的线性变换和深度可分离卷积运算后,与面料图像信息连接得到特征A,特征A进行归一化操作后输入MLP分类器,MLP分类器的输出结果与特征A进行卷积操作后,输出代表该面料图像的特征向量B,与模板库中存储的不同面料的特征向量进行比对,得到面料成分标签。
本发明具有以下有益效果:
在面料识别模块通过混合注意力层来处理高分辨率的面料图像,可以克服计算和内存成本。同时利用特征金字塔网络显著提高混合注意力机制检测密集目标任务的性能,并通过使用全局平均池化降低维度。提高了面料识别对于成分检测的准确识别率以及识别速率,极大地提高了新型面料成分检测方法在商用领域的普及性,提高了用户的体验度。
附图说明
图1为实施例中图像采集模块示意图;
图2为实施例中混合注意力识别模型示意图。
具体实施方式
以下结合附图对本发明作进一步的解释说明。
一种基于可控光源采集装置的面料成分识别系统,包括图像采集模块、数据预处理模块和面料识别模块。
如图1所示,图像采集模块包括不透光的外壳、微型摄像机和可控光源;外壳的底部设有开口,微型摄像机固定在外壳内部,拍摄方向对准外壳底部的开口;通过调整微型摄像头与外壳底部开口间的距离,可以进一步调整焦距,使拍摄的图像清晰度更高。可控光源包括多个均匀排列在外壳内壁的发光二极管,通过控制发光二极管的开关状态可以改变拍摄环境的亮度。将密封箱的底部紧密、平稳得放置在待识别面料的表面,拍摄待识别面料图像后,传输给数据预处理模块。
所述数据预处理模块通过超采样技术和基于快速双边滤波算法的细节增强技术,对面料图像进行噪声滤除和数据增强处理后,调整至128x128像素大小后进行归一化操作,以张量的形式将处理后的面料图像信息传输给面料识别模块。
收集标签已知的面料图像,经过数据预处理模块处理后输入混合注意力识别模型,利用损失函数对训练结果与标签的误差进行计算,通过梯度反向传播进行模型的迭代训练,直到模型的识别率达到85%以后,视为训练结束,将其保存到面料识别模块中。
如图2所示,所述混合注意力识别模型包括混合注意力层、多头注意力层、归一化操作和MLP分类器。所述混合注意力层包括3个阶段,每个阶段先通过卷积特征提取器生成特征向量,然后再通过多个卷积交换器得到查询矩阵、键矩阵和值矩阵,其中阶段一的输入为面料图像信息,其他阶段的输入为上一阶段输出的特征向量展开后的特征图。多头注意力层接收混合注意力层3个阶段输出的查询矩阵、键矩阵和值矩阵,进行矩阵的线性变换和深度可分离卷积运算后,与面料图像信息连接得到特征A,特征A进行归一化操作后输入MLP分类器,MLP分类器的输出结果与特征A进行卷积操作后,输出代表该面料图像的特征向量B。
所述面料识别模块首先使用训练后的混合注意力识别模型,提取不同标签的面料图像的特征向量B,存储为模板。然后提取待识别的面料图像的特征向量B,与存储的模板进行对比,将相似度最高的模板对应的标签作为待识别面料图像的成分识别结果。
以上所述实施例仅表达本发明的集中实施方式,其描述较为具体和详细,单并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应所附权利要求为准。
Claims (6)
1.一种基于可控光源采集装置的面料成分识别系统,其特征在于:包括图像采集模块、数据预处理模块和面料识别模块;
所述图像采集模块包括不透光的外壳、微型摄像机和可控光源;外壳的底部设有开口,微型摄像机和可控光源固定在外壳内部;微型摄像机的拍摄方向对准外壳底部的开口;可控光源用于提供不同强度的光照;将密封箱的底部紧密、平稳得放置在待识别面料的表面,拍摄待识别面料图像后,传输给数据预处理模块;
所述数据预处理模块对面料图像进行噪声滤除和数据增强处理后,调整至统一大小后进行归一化操作,以张量的形式将处理后的面料图像信息传输给面料识别模块;
所述面料识别模块通过训练后的混合注意力识别模型对处理后的面料图像信息进行识别,输出面料成分标签;所述混合注意力识别模型包括混合注意力层、多头注意力层、归一化操作和MLP分类器;所述混合注意力层包括3个阶段,每个阶段先通过卷积特征提取器生成特征向量,然后再通过多个卷积交换器得到查询矩阵、键矩阵和值矩阵,其中阶段一的输入为面料图像信息,其他阶段的输入为上一阶段输出的特征向量展开后的特征图;多头注意力层接收混合注意力层3个阶段输出的查询矩阵、键矩阵和值矩阵,进行矩阵的线性变换和深度可分离卷积运算后,与面料图像信息连接得到特征A,特征A进行归一化操作后输入MLP分类器,MLP分类器的输出结果与特征A进行卷积操作后,输出代表该面料图像的特征向量B,与模板库中存储的不同面料的特征向量进行比对,得到面料成分标签。
2.如权利要求1所述一种基于可控光源采集装置的面料成分识别系统,其特征在于:所述微型摄像头与外壳底部开口间的距离可以调节。
3.如权利要求1所述一种基于可控光源采集装置的面料成分识别系统,其特征在于:所述数据预处理模块通过超采样技术和基于快速双边滤波算法的细节增强技术进行图像去噪和数据增强。
4.如权利要求1所述一种基于可控光源采集装置的面料成分识别系统,其特征在于:收集标签已知的面料图像输入混合注意力识别模型进行网络训练,利用损失函数对训练结果与标签的误差进行计算,通过梯度反向传播进行模型的迭代训练,直到模型的识别率达到85%时训练结束。
5.如权利要求1所述一种基于可控光源采集装置的面料成分识别系统,其特征在于:通过训练后的混合注意力识别模型提取不同成分面料图像的特征向量,存储在模块库中;在识别过程中,将待识别面料图像的特征向量与模板库中存储的特征向量进行对比,相似度最大的模板的标签即为对应待识别面料图像的成分识别结果。
6.一种基于可控光源采集装置的面料成分识别方法,其特征在于:该方法具体包括以下步骤:
步骤1、构建混合注意力识别模型,所述混合注意力识别模型包括混合注意力层、多头注意力层、归一化操作和MLP分类器;所述混合注意力层包括3个阶段,每个阶段先通过卷积特征提取器生成特征向量,然后再通过多个卷积交换器得到查询矩阵、键矩阵和值矩阵,其中阶段一的输入为面料图像信息,其他阶段的输入为上一阶段输出的特征向量展开后的特征图;多头注意力层接收混合注意力层3个阶段输出的查询矩阵、键矩阵和值矩阵,进行矩阵的线性变换和深度可分离卷积运算后,与输入图像连接得到特征A,特征A进行归一化操作后输入MLP分类器,MLP分类器的输出结果与特征A进行卷积操作后,输出代表输入图像的特征向量B;
步骤2、收集大量成分不同的面料图像,以面料成分作为对应图像的标签,输入步骤1构建的混合注意力识别模型,利用损失函数对训练结果与标签的误差进行计算,通过梯度反向传播进行模型的迭代训练,当模型的识别率达到85%时训练结束;
步骤3、选取不同成分的面料图像,输入步骤2训练后的混合注意力识别模型中,提取特征向量B,作为模板存储在模块库中;
步骤4、使用图像采集装置采集成分未知的面料图像,作为待识别图像,经过去噪和图像增强处理后,输入步骤2训练后的混合注意力识别模型中;将模型输出的特征向量与步骤3中得到的模板进行对比,相似度最高的模板标签即为该成分未知的面料图像标签;
所述图像采集装置包括不透光的外壳、微型摄像机和可控光源;外壳的底部设有开口,微型摄像机和可控光源固定在外壳内部;微型摄像机的拍摄方向对准外壳底部的开口;可控光源用于提供不同强度的光照。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210651620.6A CN115082652A (zh) | 2022-06-09 | 2022-06-09 | 一种基于可控光源采集装置的面料成分识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210651620.6A CN115082652A (zh) | 2022-06-09 | 2022-06-09 | 一种基于可控光源采集装置的面料成分识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115082652A true CN115082652A (zh) | 2022-09-20 |
Family
ID=83252061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210651620.6A Pending CN115082652A (zh) | 2022-06-09 | 2022-06-09 | 一种基于可控光源采集装置的面料成分识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115082652A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117421611A (zh) * | 2023-12-19 | 2024-01-19 | 河北金隅鼎鑫水泥有限公司 | 一种水泥制造厂的废气成分过滤方法及系统 |
-
2022
- 2022-06-09 CN CN202210651620.6A patent/CN115082652A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117421611A (zh) * | 2023-12-19 | 2024-01-19 | 河北金隅鼎鑫水泥有限公司 | 一种水泥制造厂的废气成分过滤方法及系统 |
CN117421611B (zh) * | 2023-12-19 | 2024-04-30 | 河北金隅鼎鑫水泥有限公司 | 一种水泥制造厂的废气成分过滤方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yeh et al. | Lightweight deep neural network for joint learning of underwater object detection and color conversion | |
Işık | A comparative evaluation of well-known feature detectors and descriptors | |
WO2021036059A1 (zh) | 图像转换模型训练方法、异质人脸识别方法、装置及设备 | |
US7706601B2 (en) | Object posture estimation/correlation system using weight information | |
Fu et al. | Learning to detect specular highlights from real-world images | |
JP5366756B2 (ja) | 情報処理装置及び情報処理方法 | |
CN107766864B (zh) | 提取特征的方法和装置、物体识别的方法和装置 | |
CN107767358B (zh) | 一种图像中物体模糊度确定方法和装置 | |
CN111127384A (zh) | 基于偏振成像的强反射工件视觉测量方法 | |
TWI731919B (zh) | 圖像識別方法與裝置及度量學習方法與裝置 | |
CN115082652A (zh) | 一种基于可控光源采集装置的面料成分识别系统 | |
Potje et al. | Extracting deformation-aware local features by learning to deform | |
CN113436735A (zh) | 基于人脸结构度量的体重指数预测方法、设备和存储介质 | |
CN110866426A (zh) | 基于光场相机和深度学习的行人识别方法 | |
CN114743224B (zh) | 一种基于计算机视觉的畜牧业家畜体温监控方法与系统 | |
CN110245670B (zh) | 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置 | |
Gupta et al. | HaarCascade and LBPH Algorithms in Face Recognition Analysis | |
CN112101448B (zh) | 一种屏幕图像识别方法、设备、系统和可读存储介质 | |
CN114266713A (zh) | 基于NonshadowGAN的无人机铁路扣件图像阴影去除方法及系统 | |
CN111046861B (zh) | 识别红外影像的方法、构建识别模型的方法及应用 | |
CN112560770A (zh) | 一种基于人脸识别技术来定位幻彩智慧灯光的方法及系统 | |
Zhang et al. | A unified saliency detection framework for visible and infrared images | |
Shanmuhappriya | Automatic attendance monitoring system using deep learning | |
CN111259843B (zh) | 基于视觉稳定特征分类配准的多媒体导航仪测试方法 | |
Tian et al. | An Industrial Production Line Dynamic Target Tracking System Based on HAAR and CAMSHIFT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |