CN117079082A - 一种智能视觉图像目标物的检测方法、装置及dmc设备 - Google Patents
一种智能视觉图像目标物的检测方法、装置及dmc设备 Download PDFInfo
- Publication number
- CN117079082A CN117079082A CN202311329682.6A CN202311329682A CN117079082A CN 117079082 A CN117079082 A CN 117079082A CN 202311329682 A CN202311329682 A CN 202311329682A CN 117079082 A CN117079082 A CN 117079082A
- Authority
- CN
- China
- Prior art keywords
- picture data
- target object
- value
- picture
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 101
- 230000000007 visual effect Effects 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000010586 diagram Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 239000000428 dust Substances 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 31
- 238000012360 testing method Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000013136 deep learning model Methods 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000005520 cutting process Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000007635 classification algorithm Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 239000007789 gas Substances 0.000 description 67
- 238000004519 manufacturing process Methods 0.000 description 8
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 229910052744 lithium Inorganic materials 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000029058 respiratory gaseous exchange Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- MWUXSHHQAYIFBG-UHFFFAOYSA-N nitrogen oxide Inorganic materials O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000003792 electrolyte Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical group CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 229910001416 lithium ion Inorganic materials 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002923 metal particle Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- -1 particulates Substances 0.000 description 1
- 239000002957 persistent organic pollutant Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000012855 volatile organic compound Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种智能视觉图像目标物的检测方法、装置及DMC设备,所述检测方法包括:获取多个图片数据;对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息;对所述图片数据进行预处理,得到标准图片数据;将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别;当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。本发明提供的检测方法能够快速识别目标物。
Description
技术领域
本申请涉及人工智能算法领域,特别涉及一种智能视觉图像目标物的检测方法、装置及DMC设备。
背景技术
在锂电池行业的制造过程中,包括电芯拆解环节。在电芯拆解过程中,如果电芯内部的电解液(通常都是含有有机溶剂的电解液)与空气接触,导致产生各种有害气体,例如二甲碳酰气体。这些有害气体一般为有机化合物,具有毒性、易挥发性、易燃性,一旦泄漏,就可能引起火灾或爆炸,同时还会对人体和环境造成危害。
为了保护工人的身体健康,通常规定在有害气体浓度较高的环境下需要穿戴防毒面具。但在实际工作过程中,有些工人可能不会佩戴防毒面具,也有些工人即使佩戴防毒面具,也不够规范,不能完全防护。因此,需要开发一种能够迅速识别未穿戴防毒面具的检测检测方法。
相关技术中已有的防毒面具检测技术,大多基于静态视觉识别原理,且获取模型的训练数据来源困难,防毒面具检测技术的完整度较低,而且对工人处于不同位置、角度下的佩戴防毒面具情况无法进行准确检测。其检测方法和缺点如下:
一是基于化学吸附的检测检测方法可能受到环境温度和湿度等因素的影响,检测结果可能不够准确。二是基于气体检测仪的检测检测方法需要使用专业的检测仪器,仪器成本高,同时需要专业人员进行操作和维护。三是基于光学检测的检测方法可能受到环境光线和面具表面的污染等因素的影响,影响检测结果的准确性。四是基于电学检测的检测方法可能受到面具内部电路的干扰,影响检测结果的准确性。因此,开发一种能够迅速识别未穿戴防毒面具的检测方法势在必行。
发明内容
有鉴于此,本发明提供了一种智能视觉图像目标物的检测方法、装置及DMC设备,获取实际生产现场大量的图像数据进行模型设计和训练,并对现场的目标物进行检测,能够适应现场实际工作,逐步优化迭代,算法精确度高,后期维护便捷。
第一方面,本申请实施例提供一种智能视觉图像目标物的检测方法,其特征在于,所述检测方法包括:获取多个图片数据;其中,每一所述图片数据中包含多个目标物;对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息;对所述图片数据进行预处理,得到标准图片数据;将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别;当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。
在一些实施例中,在所述获取图片数据之前,所述检测方法还包括:对活动场景进行视频拍摄,获得待处理视频;对所述待处理视频进行切图获取多个图片;循环读取每一所述图片,当判断所述图片的拉普拉斯算子值小于等于预定值时,删除该图片;当判断所述图片的拉普拉斯算子值大于预定值时,保留该图片,得到多个图片数据。
在一些实施例中,所述目标物的坐标信息包括:每一目标物相对于其所在图片数据左上角的X、Y值、该目标物的宽和高。
在一些实施例中,对所述图片数据进行预处理,得到标准图片数据包括:依次对所述图片数据进行图像归一化处理、灰度化处理、降噪处理后得到标准图片数据。
在一些实施例中,所述将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别信息包括:按照权重将所述标准图片数据分为测试集和训练集,其中训练集权重大于测试集权重;将所述测试集输入预先训练得到的目标物检测模型中,得到测试集中每一目标物及其对应的特定特征的类别。
在一些实施例中,所述目标物检测模型的训练过程包括:通过深度学习模型对所述训练集中标准图片数据中包含的多个目标物进行特征提取,得到训练集中每一目标物对应的多个特定特征;其中,所述深度学习模型通过反向传播算法自动学习每一所述特定特征;通过分类算法对每一特定特征进行分类,得到第一类特定特征和第二类特定特征;人工判定输出的特定特征的类别与该目标物的实际特征类别不符合时,将该目标物所在的标准图片数据加入误报样本,将所述误报样本重新输入所述目标物检测模型中进行优化迭代。
在一些实施例中,所述检测方法还包括:当所述特定特征的类别为第一类特定特征时,获取当前时刻的粉尘气体浓度值,在当前时刻的粉尘气体浓度值大于安全值时,触发现场报警机制。
本申请实施例提供获取模块,用于获取多个图片数据;其中,每一所述图片数据中包含多个目标物;标记模块,对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息;预处理模块,用于对所述图片数据进行预处理,得到标准图片数据;目标物检测模块,用于将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别;输出模块,用于当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。
在一些实施例中,所述获取模块还用于:对活动场景进行视频拍摄,获得待处理视频;对所述待处理视频进行切图获取多个图片;循环读取每一所述图片,当判断所述图片的拉普拉斯算子值小于等于预定值时,删除该图片;当判断所述图片的拉普拉斯算子值大于预定值时,保留该图片,得到多个图片数据;对应的,所述装置还包括:DMC设备,用于获取当前时刻的粉尘气体浓度值;现场报警设备,用于在当前时刻的粉尘气体浓度值大于安全值时,触发现场报警机制。
本申请实施例提供一种DMC设备,所述DMC设备中包括:传感器,用于获取当前时刻的DMC浓度基准值;主机,用于对当前时刻的DMC浓度基准值依次进行平滑、滤波、去噪处理得到当前时刻的粉尘气体浓度值。
本发明采用了前沿的计算机视觉算法,结合DMC设备实现创新的防毒面具识别方法,具有快速、准确的优点,能够提高工人的安全性,更好适应活动现场的复杂环境。
附图说明
图1为本申请实施例1提供的检测方法的流程示意图;
图2为本申请实施例3提供的检测装置的组成示意图。
具体实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
实施例1 本申请实施例1提供一种智能视觉图像目标物的检测方法,图1为本申请实施例1提供的检测方法的流程示意图,参考图1,所述检测方法包括:
步骤S101:获取多个图片数据;其中,每一所述图片数据中包含多个目标物。这里目标物为本实施例提供的智能视觉图像目标物的检测方法的检测对象,通过本方法来识别目标物的类别,以达到区分目标物的目的。目标物可以是特定物体、人体、人体部位等。
步骤S102:对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息。这里利用标注工具对每张图片数据进行目标物框图处理,将每张图片数据中的每一目标物进行框图,得到与每张图片数据一一对应的标记文件,这个标记文件为XML文件,该标记文件中包括每一目标物的坐标信息,该坐标信息用于表示该目标物在该图片数据中的位置信息。
步骤S103:对所述图片数据进行预处理,得到标准图片数据。
步骤S104:将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别。预先训练得到的目标物检测模型的输入端为标准图片数据,输出端为标准图片数据中的目标物对应的特定特征的类别,通过目标物检测模型,检测得到该目标物的类别。特定特征为预先设置的一系列特征,例如物体的颜色、人的性别、人脸是否戴口罩、头部是否戴面具等等。
步骤S105:当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。
当该目标物的特定特征满足预设条件时,这里的预设条件为第一类特定特征,输出该目标物的坐标信息并发出告警信息,例如,当人脸戴口罩时,输出该人脸的坐标信息并发出告警,当一张图片数据中包含的多个目标物同时满足预设条件时,输出所有目标物的坐标信息并发出告警信息。
本申请实施例提供的检测方法,通过对图片数据进行框图标注出其中多个目标物,采用目标检测模型依次对每一图片数据中的目标物进行特定特征分类,当特定特征满足预定条件时输出目标物的坐标信息并发出告警,提高目标检测效率和准确度。
实施例2 本申请实施例2提供一种智能视觉图像目标物的检测方法,该检测方法可用于防毒面具识别,例如在工业领域,对工人是否佩戴防毒面具进行检测和识别,从而保障工人的安全。在军事领域,在于军事训练和实战中监测士兵是否佩戴防毒面具,提高生化战争的应对能力。在医疗领域,用于检测医护人员是否佩戴防毒面具进,从而保障医护人员的安全。以及其他领域,如地铁、机场等,对工作人员是否佩戴防毒面具进行监测和识别,从而保障公众的健康和安全。
示例性地,所述检测方法用于锂电池生产现场的防毒面具检测时,所述检测方法包括:
步骤S201:对活动场景进行视频拍摄,获得待处理视频;对所述待处理视频进行切图获取多个图片。
本申请实施例2提供的检测方法可以用于检测锂电池生产现场的人员是否正确佩戴防毒面具,活动场景是锂电池拆解现场,首先参考场景内员工拆解电芯的桌面位置,进行摄像机的安装。从桌面的正对和对角线等不同角度安装多个400万像素的5G高清摄像机,然后调整合适的焦距,使摄像机成像清晰,能够覆盖电芯拆解间人员可活动的所有视野。其次,根据现场的光线强度,对摄像机的曝光率进行合理调整,避免过黑过亮,反光等情况,使画面明暗度适中。通过摄像机拍摄采集大量的待处理视频,从待处理视频中进行切图获取多个图片。这里的待处理视频中包括正样本和负样本,正样本是指工作人员合理佩戴了防毒面具的视频,负样本是指工作人员没有佩戴防毒面具,或者佩戴不合理的视频。
步骤S202:循环读取每一所述图片,当判断所述图片的拉普拉斯算子值小于等于预定值时,删除该图片;当判断所述图片的拉普拉斯算子值大于预定值时,保留该图片,得到多个图片数据。这里,步骤S201获取的图片中包含清晰的、模糊的或花屏的图片,采用拉普拉斯方法对多个图片进行数据清洗,以过滤掉模糊、花屏的图片,从而保留清晰的图片。所述图片的拉普拉斯算子值通过以下过程得到:将每一图片的像素值与拉普拉斯矩阵模板对应的像素相乘,并将所有结果相加,得到新的像素值,即为该图片的拉普拉斯算子值。预先设置拉普拉斯算子值的预定值,例如1000,循环读取每一图片,判断该图片的拉普拉斯算子值与预定值的大小,当图片的拉普拉斯算子值小于等于预定值,说明该图片为模糊图片,对该图片进行删除,当图片的拉普拉斯算子值大于预定值,保留该图片,如此,经过清洗得到拉普拉斯算子值均大于预定值的图片数据。这里预定值是图片模糊与清晰的界定值,是一个多次实验后得到的分水岭的值,可以根据对图片的需求来设定,在此不做限制。
步骤S203:获取多个图片数据;其中,每一所述图片数据中包含多个目标物。这里,目标物可以是人体的面部。由于在活动现场安装了覆盖可获得全部视野的多个摄像机,因此,当人员在某一摄像机中的图片数据中为背面朝向,无法判断是否佩戴防毒面具时,可以通过其他角度摄像机的图片数据呈现其正面,并判断是否佩戴防毒面具,以此防止漏检、误检。
步骤S204:对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息。这里利用标注工具对每张图片数据进行目标物框图处理,将每张图片数据中的每一目标物进行框图,得到与每张图片数据一一对应的标记文件,标记文件为XML文件,该标记文件中包括每一目标物的坐标信息,该坐标信息用于表示该目标物在该图片数据中的位置信息。本申请实施例的标记文件中还包括,通过所述目标检测方法得到的每个目标物框图对应的置信度数据,置信度数据越高,说明该框图中包含目标物的概率越大,置信度的值在0到1之间。
在本申请实施例中,所述目标物的坐标信息包括:每一目标物相对于其所在图片数据左上角的X、Y值、该目标物的宽和高。以图片数据的左上角为坐标原点,记录每一目标物的X、Y值,经过框图得到目标物的宽和高。
步骤S205:对所述图片数据进行预处理,得到标准图片数据。在本申请实施例中,对图片数据进行预处理,得到标准图片数据包括:依次对所述图片数据进行图像归一化处理、灰度化处理、降噪处理后得到标准图片数据。
步骤S206:将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别。
在将标准图片数据输入目标物检测模型中之前,按照权重将所述标准图片数据分为测试集和训练集,其中训练集权重大于测试集权重;随后将所述测试集输入预先训练得到的目标物检测模型中,得到测试集中每一目标物及其对应的特定特征的类别。这里,权重可以根据需要设定,且训练集权重大于测试集,例如测试集权重为30%、训练集权重为70%,或者测试集权重为20%、训练集权重为80%。可以理解的是,训练集中包含正样本和负样本,用于模型训练。
目标物检测模型使用了YOLOv5的检测框架,通过对其进行训练得到了目标检测模型,YOLOv5是一种目标检测算法,该算法在目标检测领域具有较高的性能,广泛应用于自动驾驶、安防监控、工业检测等方面。
YOLOv5的基本思想是将输入的图片数据分成网格,每个网格负责检测其中的物体。在每个网格中,对于每个类别,都会输出一个置信度,表示该网格中是否存在该类别的物体。同时,对于每个物体,还会输出一个框图,用于定位物体的位置和大小。YOLOv5的网络结构是一种基于骨干网络和特征金字塔网络的结构。其中,骨干网络用于提取图片数据的特征,而特征金字塔网络则用于在不同尺度上进行目标检测。具体来说,YOLOv5使用的是CSPNet骨干网络和PANet特征金字塔网络,在网络结构上进行了一些优化,以提高检测性能和速度。YOLOv5使用的是一种基于IoU的多任务损失函数。该损失函数包括三部分:分类损失、边界框损失和置信度损失。其中,分类损失用于衡量分类的准确性,边界框损失用于衡量边界框的准确性,置信度损失用于衡量检测的准确性。YOLOv5使用的是Focal Loss和CIoU Loss来计算损失值,以提高模型的鲁棒性和精度。YOLOv5的训练过程使用的是一种基于自适应热启动和多尺度训练的方法。在自适应热启动中,网络会从小模型逐渐增加到大模型,以加速训练过程。在多尺度训练中,网络会在不同尺度下进行训练,以提高模型的泛化能力和精度。
本申请实施例中目标检测模型的训练过程包括以下步骤:
步骤S61:将所述训练集输入深度学习模型,通过深度学习模型对所述训练集中标准图片数据中包含的多个目标物进行特征提取,得到训练集中每一目标物对应的多个特定特征。利用现有深度学习模型,例如卷积神经网络(CNN)等,依次对每一标准图片数据中的多个目标物进行特征提取。每一目标物可以包含多个特定特征,这里,特定特征包括但不限于边缘、角点、纹理、形状、颜色等。
步骤S62:所述深度学习模型通过反向传播算法自动学习每一所述特定特征;通过反向传播算法,深度学习模型可以自动学习目标物的每一特定特征,以便后续分类算法使用。
步骤S63:通过分类算法对每一特定特征进行分类,得到第一类特定特征和第二类特定特征;使用支持向量机(SVM)等分类算法,对深度学习模型提取的特定特征进行分类,得到第一类特定特征和第二类特定特征。本申请实施例中,对于分类得到的的第一类特定特征和第二类特定特征,给出不同的类别标签。这里第一类特定特征和第二类特定特征可以按照需求设置,例如,在判断人体面部是否佩戴防毒面具时,可以通过判断目标物的特定特征,即人体面部的颜色,并给出每个目标物类别标签,当颜色这一特定特征为浅色时,如白色、浅黄色、浅粉色,分类得到浅色为第一类特定特征判定为未佩戴防毒面具,则相应的目标物的类别标签为Unmask;当颜色为深色时,如黑色,分类得到深色为第二特定特征判定为佩戴防毒面具,则相应的目标物的类别标签为Mask。
步骤S207:当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。
这里,当特定特征为第一类特定特征时,此时可以触发客户端发出告警信息,并同时输出该目标物的坐标信息,如此可快速确定出目标物所在位置,例如可以在该图片数据上以框图高亮的方式显示该目标物,告警信息可以是告警铃、告警灯光、告警文字或告警语音等方式发出。如此,在任意情况下,都能实施检测进入活动场景人员是否佩戴防毒面具。
在本申请实施例中,上述目标检测模型的训练过程还包括优化迭代步骤:
步骤S64:人工判定输出的特定特征的类别与该目标物的实际特征类别不符合时,将该目标物所在的标准图片数据加入误报样本,将所述误报样本重新输入所述目标物检测模型中进行优化迭代。
根据人工判断,当输出的特定特征的类别有误时,将判断错误的标准图片数据加入误报样本,通过交叉验证等技术,在测试阶段,对目标检测模型进行优化迭代,提高模型的准确率和鲁棒性(抗外部环境如遮挡、光线等干扰能力),以便能够在实时场景中快速准确地识别目标物。
对训练集中的每一张图片数据依次进行步骤S61至步骤S64,通过上述目标检测模型的训练与优化迭代,不断完善目标检测模型,提高目标检测模型的准确率。通过以下公式计算本申请实施例提供的目标检测模型的准确率和召回率:
准确率=正检数÷检测数×100% (1)
召回率=正检数÷实际告警数×100% (2)
其中,正检数为对目标物类别判断正确的样本数量,实际告警数为对目标物进行类别判断的样本数量,即其中同时包含对目标物类别判断正确和对目标物类别判断错误的样本。具体的,本申请实施例通过大量的测试集对所述目标检测模型进行训练验证,得到了99.83%的准确率和99.56%的召回率,表明经过训练得到的目标检测模型的检测效果好,提高目标检测的准确率和效率。本申请实施例提供了一种用于锂离子电池拆解现场人员佩戴防毒面具检测的全套方法,获取了实际生产现场大量的样本数据进行模型设计和训练,适应现场实际工作,逐步优化迭代,算法精确度高,后期维护便捷。
在一些实施例中,步骤S207还包括:当所述特定特征的类别为第一类特定特征时,获取当前时刻的粉尘气体浓度值,在当前时刻的粉尘气体浓度值大于安全值时,触发现场报警机制。
当本申请实施例的检测方法检测到未正常佩戴防毒面具的情况时,会结合DMC设备提供的现场当前时刻粉尘气体浓度值来辅助识别异常,当现场粉尘气体浓度值超出预定值例如5%时,确认现场正处在生产中,且存在未正常佩戴防毒面具的人员,则立即触发现场的声光报警机制,并实时推送告警消息到相应的负责人手机端。如此,在工作情况下,此时活动场景中存在粉尘气体,可通过现场报警机制提醒工作人员,避免现场工作人员吸入粉尘气体造成伤害。本实施例提供的检测方法结合DMC设备获取粉尘气体浓度值的动态,能够实时识别现场人员是否穿戴防毒面具,解决了市场上现有防毒面具检测技术的不足之处,提高锂电池行业工人的生产安全。
本申请实施例中的粉尘气体包括但不限于:各种气体污染物、颗粒物、粉尘、有害气体、悬浮颗粒物、氮氧化物、挥发性有机化合物、有机污染物、重金属颗粒、放射性颗粒物质、可吸入颗粒物等。
这里,当前时刻的粉尘气体浓度是由DMC(Dust Monitoring Component,粉尘监测组件)设备测量得到的,DMC设备是一种用于测量空气中粉尘气体浓度的设备,使用激光散射技术进行测量。粉尘气体浓度值的获取方法包括以下步骤:
步骤S71:安装DMC设备。首先需要在需要测量粉尘气体浓度值的区域内安装DMC设备。DMC设备通常由主机和传感器组成,传感器需要放置在空气流动的位置上以获得准确的测量结果。
步骤S72:连接设备并进行校准。连接DMC设备并进行校准,确保设备能够正常工作并给出准确的测量结果。校准通常需要在不同条件下进行,例如不同温度、湿度和粉尘浓度下进行。
步骤S73:进行测量。在设备进行校准后,可以开始进行实际的测量。DMC设备通过激光散射技术,将激光束照射到空气中的粉尘上,然后测量被散射的激光光强,从而得到粉尘气体浓度基准值。
步骤S74:数据处理。获得传感器测量的粉尘气体浓度基准值后,对数据进行平滑、滤波、去噪处理,然后得到更加准确的粉尘气体浓度值。
本申请实施例提供的智能视觉图像目标物的检测方法,使用深度学习算法进行防毒面具图像分析,训练出能够识别未穿戴防毒面具的模型,能够有效地避免传统静态视觉识别技术的缺陷,并在现场环境下实现快速准确的防毒面具识别。结合了DMC设备对粉尘气体浓度值进行实时监测,能够进一步提高工人的安全,掌握现场粉尘气体浓度值的变化情况,及时采取措施。计算机视觉算法的优秀性能,能够灵活适应现场工人处于不同位置、角度下的情况,更准确地识别未穿戴防毒面具的情况,增强了方法的适应性。计算机视觉算法结合DMC设备能够自动化地对未正常佩戴防毒面具进行识别和分析,大大减少人工干预的需求,提高了识别的效率和准确性。
实施例3 本申请实施例提供一种智能视觉图像目标物的检测装置,图2为本申请实施例3提供的检测装置的组成示意图,参考图2,所述装置200包括:
获取模块201,用于获取多个图片数据;其中,每一所述图片数据中包含多个目标物。标记模块202,用于对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息。预处理模块203,用于对所述图片数据进行预处理,得到标准图片数据。目标物检测模块204,用于将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别。输出模块205,用于当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。
在一些实施例中,获取模块201还用于对活动场景进行视频拍摄,获得待处理视频;对所述待处理视频进行切图获取多个图片;循环读取每一所述图片,当判断所述图片的拉普拉斯算子值小于等于预定值时,删除该图片;当判断所述图片的拉普拉斯算子值大于预定值时,保留该图片,得到多个图片数据。上述装置200还包括:DMC设备,用于获取当前时刻的粉尘气体浓度值;现场报警设备,用于在当前时刻的粉尘气体浓度值大于安全值时,触发现场报警机制。现场报警机制包括现场声光报警,还包括客户端的报警提示,保障现场人员的安全性,加强管理人员对员工的生命生产安全管控。
实施例4 本申请实施例提供一种DMC设备,其特征在于,所述DMC设备中包括:
传感器,用于获取当前时刻的粉尘气体浓度基准值;这里,在需要测量粉尘气体浓度的区域内安装DMC设备。将传感器放置在空气流动的位置上以获得准确的测量结果。
主机,用于对当前时刻的粉尘气体浓度基准值依次进行平滑、滤波、去噪处理得到当前时刻的粉尘气体浓度值。这里,主机与传感器连接,对传感器获得的粉尘气体浓度基准值进行平滑、滤波、去噪处理,然后得到更加准确的粉尘气体浓度值,并发送当前时刻的粉尘气体浓度值至实施例3提供的智能视觉图像目标物的检测装置中的现场报警设备。
以上所述仅是本发明的优选实施例而已,并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种智能视觉图像目标物的检测方法,其特征在于,所述检测方法包括:
获取多个图片数据;其中,每一所述图片数据中包含多个目标物;
对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息;
对所述图片数据进行预处理,得到标准图片数据;
将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别;
当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。
2.根据权利要求1所述的检测方法,其特征在于,在所述获取图片数据之前,所述检测方法还包括:
对活动场景进行视频拍摄,获得待处理视频;
对所述待处理视频进行切图获取多个图片;
循环读取每一所述图片,当判断所述图片的拉普拉斯算子值小于等于预定值时,删除该图片;
当判断所述图片的拉普拉斯算子值大于预定值时,保留该图片,得到多个图片数据。
3.根据权利要求1所述的检测方法,其特征在于,所述目标物的坐标信息包括:
每一目标物相对于其所在图片数据左上角的X、Y值、目标物的宽和高。
4.根据权利要求1所述的检测方法,其特征在于,对所述图片数据进行预处理,得到标准图片数据包括:
依次对所述图片数据进行图像归一化处理、灰度化处理、降噪处理后得到标准图片数据。
5.根据权利要求1所述的检测方法,其特征在于,所述将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别包括:
按照权重将所述标准图片数据分为测试集和训练集,其中训练集权重大于测试集权重;
将所述测试集输入预先训练得到的目标物检测模型中,得到测试集中每一目标物及其对应的特定特征的类别。
6.根据权利要求5所述的检测方法,其特征在于,所述目标物检测模型的训练过程包括:
通过深度学习模型对所述训练集中标准图片数据中包含的多个目标物进行特征提取,得到训练集中每一目标物对应的多个特定特征;其中,所述深度学习模型通过反向传播算法自动学习每一所述特定特征;
通过分类算法对每一特定特征进行分类,得到第一类特定特征和第二类特定特征;
人工判定输出的特定特征的类别与该目标物的实际特征类别不符合时,将该目标物所在的标准图片数据加入误报样本,将所述误报样本重新输入所述目标物检测模型中进行优化迭代。
7.根据权利要求1所述的检测方法,其特征在于,所述检测方法还包括:
当所述特定特征的类别为第一类特定特征时,获取当前时刻的粉尘气体浓度值,在当前时刻的粉尘气体浓度值大于安全值时,触发现场报警机制。
8.一种智能视觉图像目标物的检测装置,其特征在于,所述装置包括:
获取模块,用于获取多个图片数据;其中,每一所述图片数据中包含多个目标物;
标记模块,对所述图片数据进行目标物框图处理,得到与每一所述图片数据一一对应的标记文件,所述标记文件中包括图片数据和该图片数据中包含的多个目标物的坐标信息;
预处理模块,用于对所述图片数据进行预处理,得到标准图片数据;
目标物检测模块,用于将所述标准图片数据输入预先训练得到的目标物检测模型中,得到标准图片数据中每一目标物及其对应的特定特征的类别;
输出模块,用于当所述特定特征的类别为第一类特定特征时,输出该目标物的坐标信息并发出告警信息。
9.根据权利要求8所述的装置,其特征在于,所述获取模块还用于:
对活动场景进行视频拍摄,获得待处理视频;对所述待处理视频进行切图获取多个图片;循环读取每一所述图片,当判断所述图片的拉普拉斯算子值小于等于预定值时,删除该图片;当判断所述图片的拉普拉斯算子值大于预定值时,保留该图片,得到多个图片数据;
对应的,所述装置还包括:
DMC设备,用于获取当前时刻的粉尘气体浓度值;
现场报警设备,用于在当前时刻的粉尘气体浓度值大于安全值时,触发现场报警机制。
10.一种根据权利要求9所述的装置,其特征在于,所述DMC设备中包括:
传感器,用于获取当前时刻的粉尘气体浓度基准值;
主机,用于对当前时刻的粉尘气体浓度基准值依次进行平滑、滤波、去噪处理得到当前时刻的粉尘气体浓度值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311329682.6A CN117079082A (zh) | 2023-10-16 | 2023-10-16 | 一种智能视觉图像目标物的检测方法、装置及dmc设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311329682.6A CN117079082A (zh) | 2023-10-16 | 2023-10-16 | 一种智能视觉图像目标物的检测方法、装置及dmc设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117079082A true CN117079082A (zh) | 2023-11-17 |
Family
ID=88717501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311329682.6A Pending CN117079082A (zh) | 2023-10-16 | 2023-10-16 | 一种智能视觉图像目标物的检测方法、装置及dmc设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117079082A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117854211A (zh) * | 2024-03-07 | 2024-04-09 | 南京奥看信息科技有限公司 | 一种基于智能视觉的目标对象识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080317329A1 (en) * | 2007-06-20 | 2008-12-25 | Hitachi High-Technologies Corporation | Visual Inspection Method and Apparatus and Image Analysis System |
CN113903081A (zh) * | 2021-09-29 | 2022-01-07 | 北京许继电气有限公司 | 一种水电厂图像视觉识别人工智能报警方法及装置 |
CN114529869A (zh) * | 2022-02-16 | 2022-05-24 | 北京京能电力股份有限公司 | 违章动火检测模型的训练方法及利用该模型的检测方法 |
-
2023
- 2023-10-16 CN CN202311329682.6A patent/CN117079082A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080317329A1 (en) * | 2007-06-20 | 2008-12-25 | Hitachi High-Technologies Corporation | Visual Inspection Method and Apparatus and Image Analysis System |
CN113903081A (zh) * | 2021-09-29 | 2022-01-07 | 北京许继电气有限公司 | 一种水电厂图像视觉识别人工智能报警方法及装置 |
CN114529869A (zh) * | 2022-02-16 | 2022-05-24 | 北京京能电力股份有限公司 | 违章动火检测模型的训练方法及利用该模型的检测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117854211A (zh) * | 2024-03-07 | 2024-04-09 | 南京奥看信息科技有限公司 | 一种基于智能视觉的目标对象识别方法及装置 |
CN117854211B (zh) * | 2024-03-07 | 2024-05-28 | 南京奥看信息科技有限公司 | 一种基于智能视觉的目标对象识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111598040B (zh) | 一种建筑工人身份识别及安全帽佩戴检测方法及系统 | |
CN110414334B (zh) | 一种基于无人机巡视的智能水质识别方法 | |
CN109308447A (zh) | 在电力远程监控中自动提取设备运行参数和运行状态的方法 | |
CN110807429A (zh) | 基于tiny-YOLOv3的施工安全检测方法及系统 | |
CN117079082A (zh) | 一种智能视觉图像目标物的检测方法、装置及dmc设备 | |
CN112131951B (zh) | 一种自动化识别施工中违规使用梯子行为的系统 | |
CN111798407A (zh) | 一种基于神经网络模型的带电设备故障诊断方法 | |
Zhafran et al. | Computer vision system based for personal protective equipment detection, by using convolutional neural network | |
CN113111817A (zh) | 语义分割的人脸完整度度量方法、系统、设备及存储介质 | |
CN112989989A (zh) | 一种安检方法、装置、设备及存储介质 | |
CN115171361B (zh) | 一种基于计算机视觉的危险行为智能检测预警方法 | |
CN111259855A (zh) | 基于深度学习的移动式安全帽佩戴检测方法 | |
CN112818806A (zh) | 一种基于深度学习的变电站巡检机器人辅助导航方法 | |
CN104698888B (zh) | 车辆火灾事故信息处理方法及系统 | |
Soh et al. | Riverbank Monitoring using Image Processing for Early Flood Warning System via IoT | |
CN111523750A (zh) | 一种基于泛在电力物联网的水电厂危险源识别马甲 | |
CN116959028B (zh) | 监管高空作业安全的方法和巡检设备及计算设备 | |
CN111814787B (zh) | 一种面向可见光图像的锁孔检测方法 | |
CN115376275B (zh) | 一种基于图像处理的施工安全告警方法及系统 | |
CN113203841B (zh) | 基于多传感器协同的有害气体检测系统及方法 | |
CN116778192B (zh) | 一种基于空地设备协同的火灾安全预警系统 | |
CN215979489U (zh) | 一种矿井内危险区域入侵监测装置 | |
CN117253176A (zh) | 基于视频分析与计算机视觉的安全生产Al智能检测方法 | |
CN112329611A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
Enggari et al. | Identification of Air Pollution Levels Based on Sky Image Using Color Histogram Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |