CN116434062A - 一种利用ai算法的漂浮物图像识别方法 - Google Patents
一种利用ai算法的漂浮物图像识别方法 Download PDFInfo
- Publication number
- CN116434062A CN116434062A CN202310344727.0A CN202310344727A CN116434062A CN 116434062 A CN116434062 A CN 116434062A CN 202310344727 A CN202310344727 A CN 202310344727A CN 116434062 A CN116434062 A CN 116434062A
- Authority
- CN
- China
- Prior art keywords
- image
- difference
- algorithm
- area
- identifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 208000034699 Vitreous floaters Diseases 0.000 claims abstract description 30
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000013145 classification model Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/54—Extraction of image or video features relating to texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像识别技术领域,具体涉及了一种利用AI算法的漂浮物图像识别方法。包括以下步骤:S100:获取检测水域的影像,生成图像序列,并将第一帧图像作为对比图像:S200:将图像序列中除第一帧图像外的其他帧图像分别与对比图像进行比对,提取出差异部分;S300:对差异区域进行识别,根据差异部分的面积判断是否为存在漂浮物;S400:若判断结果为存在漂浮物,则提取差异部分的纹理,并根据差异部分的纹理识别漂浮物的类型。能够提高对水面漂浮物的识别准确率。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及了一种利用AI算法的漂浮物图像识别方法。
背景技术
漂浮于水上并随水流一起运动的物体称为漂浮物,漂浮物包括不溶于水的无机物、有机物、泥沙、黏土、微生物、原生动物、藻类、细菌、病毒以及高分子有机物等,同时也包括了常见的固体垃圾、树枝、木头、水生植物等。漂浮物会直接影响到水体的生态系统,堵塞河道或水道,影响水体的正常流动,堵塞严重时还会引发水位上升,或影响水库、河道泄洪等。
传统的对于漂浮物的识别还是基于人工定时巡查水库、河道的作业方式来发现漂浮物的问题,对于传统的方式存在响应不及时,特别是在天气状况不好,或视野不好的晚上等情况下,不能及时的发现问题。
现有技术中虽然存在通过目标检测类的模型对漂浮物进行监测,其工作逻辑为根据识采集到的图像中移动的物体进行识别,辨别是否为漂浮物。其存在的问题的仅限于外观规则的、较大的物体,对于不规则或较小的物体的识别率不够。
发明内容
本发明所解决的技术问题在于提供一种利用AI算法的漂浮物图像识别方法,能够提高对水面漂浮物的识别准确率。
本发明提供的基础方案:一种利用AI算法的漂浮物图像识别方法,包括以下步骤:
S100:获取检测水域的影像,生成图像序列,并将第一帧图像作为对比图像:
S200:将图像序列中除第一帧图像外的其他帧图像分别与对比图像进行比对,提取出差异部分;
S300:对差异区域进行识别,根据差异部分的面积判断是否为存在漂浮物;
S400:若判断结果为存在漂浮物,则提取差异部分的纹理,并根据差异部分的纹理识别漂浮物的类型。
本发明的原理在于:准备好检测水域的影像,生成图像序列,将第一帧图像作为对比图像,将其他帧的图像与对比图像进行比对。由于漂浮物在影像中会随着水流移动,也能是外来的新出现在图像中,因此通过对比其他帧图像与对比图像的差异区域,差异区域即是发生过变化的区域,因此将其他帧图像与对比图像比对后得到的差异区域,则是可能存在的漂浮物。之后根据差异区域的面积,通常来说水面上的漂浮物包括有木头、植物、塑料、固体垃圾等,均在一个特定的大小范围内,因此根据识别到的差异区域的面积,便能够确定产生变化的是否为漂浮物。当是漂浮物时,则根据差异区域的纹理,对漂浮物的类型进行识别。
相比于现有技术,存在以下优点:
相比于传统的对目标进行监测,本方案中主要是进行对图像像素级的区域分析,通过像素级的识别,对比分析出图像中产生过变化的区域,从而确定处外来物体或者是产生移动的物体,而后只对差异部分进行纹理识别,便能够得出漂浮物的类型。
本方案中将漂浮物的识别过程,分成了发现漂浮物和识别漂浮物两个步骤来完成,首先对于识别到的差异区域的面积,对数据进行剔除,减少数据量,在对漂浮物类型进行识别时,仅需要对保留的差异区域进行识别即可。从而降低整体运算的计算量,相比于传统的对目标类型进行监控的算法,需要实时监测影响中是否有监测目标出现的方式,对设备要求更低,更能够得到大量推广。
进一步,所述S200包括以下步骤:
S210:对其他帧图像的原始图像进行预处理,得到识别图像;
S220:以对比图像作为背景图像,通过前景提取算法,对识别图像提取差异图像像素矩阵;
S230:通过等值线算法,提取差异图像像素矩阵中的差异区域序列;
S240:将差异区域序列等比例应用在其他帧图像的原始图像中,生成原始图像差异区域集合。
对其他帧图像的原始图像进行预处理后,得到进行识别对照用的识别图像。将识别图像作为背景图,采用前景提取算法,从而提取出差异区域的像素矩阵,在根据差异区域的像素矩阵,通过等值线算法提取等值线,从而获取到像素矩阵的差异区域序列,再将差异区域序列放到原始图像中,便能够标注出原始图像差异区域集合。通过进行预处理后的图像,对图像完成统一,以及降低计算量。
进一步,所述S210包括以下步骤:
S211:将输入的原始图像转换成RGB模式的图像矩阵数据集,输出数据I;
S212:输入数据I,采用图像增强算法,调整图像亮度,减少图像噪点,输出数据F;
S213:将数据F图像分辨率缩放至512*512。
对原始图像模式进行转化,图像增强以及分辨率调整,在识别前完成图像的统一,提高识别效率,减少计算量。
进一步,所述S300包括以下步骤:
S310:根据原始图像差异区域中,各差异区域的面积,若差异区域的面积小于预设的最小阈值,或者是大于预设的最大预设,则从差异区域序列中剔除。
若是面积过小,可能是水面波动等其他原因导致。若是面积过大,则可能是人,或者船只等,因此选择合适的面积范围,对该面积范围内的差异区域进行提取。
进一步,将保留的差异区域输入到预训练号的纹理分类模型中,输出漂浮物分类类型。
保留的差异区域即使识别出的存在的漂浮物,不同类型的漂浮物有着不同的纹理,通过对纹理进行识别,从而确定处漂浮物的类型。
附图说明
图1为本发明一种利用AI算法的漂浮物图像识别方法实施例的流程示意图;
图2为本发明一种利用AI算法的漂浮物图像识别方法实施例S200的流程示意图。
具体实施方式
下面通过具体实施方式进一步详细说明:
实施例基本如附图1所示:
一种利用AI算法的漂浮物图像识别方法,包括以下步骤:
S100:获取检测水域的影像,生成图像序列,并将第一帧图像作为对比图像。
具体的,通过在需要进行漂浮物监测的检测水域处设置摄像机,并将摄像机采集到的数据上传,每隔一端时间,提取一段时间内的影像生成图像序列,将图像序列中的第一帧图像作为对比图像。
S200:将图像序列中除第一帧图像外的其他帧图像分别与对比图像进行比对,提取出差异部分。其他帧图像为图像序列中非第一帧图像外的其他帧的图像,漂浮物在水面上漂浮或者是外来的漂浮物出现在水面上,在各帧图像中的位置会不同,因此将其他帧图像与对比图像进行比对,能够识别出差异部分。S200如图2所示具体包括以下步骤:
S210:对其他帧图像的原始图像进行预处理,得到识别图像。通过对原始图像进行预处理,完成各帧图像色彩、分辨率、亮度等要素的统一,提高识别效率。S210具体包括以下步骤:
S211:将输入的原始图像转换成RGB模式的图像矩阵数据集,输出数据I。RGB色彩指的是是常说的光学三原色,R代表Red(红色),G代表Green(绿色),B代表Blue(蓝色),自然界中肉眼所能看到的任何色彩都可以由这三种色彩混合叠加而成,因此也称为加色模式。本实施例中采用RGB16格式中的RGB565,每个像素用16比特位表示,占2个字节,第一字节的前5位是R,后三位+第二字节前三位是G,第二字节后5位是B。
S212:输入数据I,采用图像增强算法,调整图像亮度,减少图像噪点,输出数据F。通过图像增强,对退化的某些图像特征,如边缘、轮廓、对比度等进行处理,以改善图像的视觉效果,提高图像的清晰度。
S213:将数据F图像分辨率缩放至512*512。对图像的分辨率进行调整,保证分辨率统一且容易识别分析。
S220:以对比图像作为背景图像,通过前景提取算法,对识别图像提取差异图像像素矩阵。具体的,采用Cv2.Absdiff方法,该算法能将两幅图中的差的绝对值输出到另一幅图上来,从而提取出差异图像的像素矩阵,常用于运动检测。
S230:通过等值线算法,提取差异图像像素矩阵中的差异区域序列。具体的,本实施例中采用Cv2.Comtour方法,将像素矩阵转换为等值线矩阵,该方法主要用于对图像的边缘进行提取,沿着图像边缘连接起来生成轮廓线。
S240:将差异区域序列等比例应用在其他帧图像的原始图像中,生成原始图像差异区域集合。将提取到的轮廓线等比例放在原始图像汇总,从而得到轮廓线包围的区域便是原始图像差异区域。之后采用滤波函数Cv2.MorphologyEx过滤噪点,并平滑提取出图像矩阵边缘。
S300:对差异区域进行识别,根据差异部分的面积判断是否为存在漂浮物。S300具体包括以下步骤:
S310:根据原始图像差异区域中,各差异区域的面积,若差异区域的面积小于预设的最小阈值,或者是大于预设的最大预设,则从差异区域序列中剔除。
具体的,本实施例汇总剔除图元面积小于m,或面积大于M的差异区域的图元,m为图像分辨率的0.05,M为图像分辨率的0.5。
S400:若判断结果为存在漂浮物,则提取差异部分的纹理,并根据差异部分的纹理识别漂浮物的类型。具体的,S400包括以下步骤:
S410:将保留的差异区域输入到预训练号的纹理分类模型中,输出漂浮物分类类型。具体的,通过预训练纹理分类神经网络模型对集合纹理进行识别,得到集合对应的纹理分类集合。包括有木头纹理、植物纹理、塑料纹理等。最终输出该帧图像的图元集合所保护的纹理类型,从而确定检测水域存在什么类型的漂浮物。
以上的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
Claims (5)
1.一种利用AI算法的漂浮物图像识别方法,其特征在于:包括以下步骤:
S100:获取检测水域的影像,生成图像序列,并将第一帧图像作为对比图像:
S200:将图像序列中除第一帧图像外的其他帧图像分别与对比图像进行比对,提取出差异部分;
S300:对差异区域进行识别,根据差异部分的面积判断是否为存在漂浮物;
S400:若判断结果为存在漂浮物,则提取差异部分的纹理,并根据差异部分的纹理识别漂浮物的类型。
2.根据权利要求1所述的一种利用AI算法的漂浮物图像识别方法,其特征在于:所述S200包括以下步骤:
S210:对其他帧图像的原始图像进行预处理,得到识别图像;
S220:以对比图像作为背景图像,通过前景提取算法,对识别图像提取差异图像像素矩阵;
S230:通过等值线算法,提取差异图像像素矩阵中的差异区域序列;
S240:将差异区域序列等比例应用在其他帧图像的原始图像中,生成原始图像差异区域集合。
3.根据权利要求2所述的一种利用AI算法的漂浮物图像识别方法,其特征在于:所述S210包括以下步骤:
S211:将输入的原始图像转换成RGB模式的图像矩阵数据集,输出数据I;
S212:输入数据I,采用图像增强算法,调整图像亮度,减少图像噪点,输出数据F;
S213:将数据F图像分辨率缩放至512*512。
4.根据权利要求3所述的一种利用AI算法的漂浮物图像识别方法,其特征在于:所述S300包括以下步骤:
S310:根据原始图像差异区域中,各差异区域的面积,若差异区域的面积小于预设的最小阈值,或者是大于预设的最大预设,则从差异区域序列中剔除。
5.根据权利要求4所述的一种利用AI算法的漂浮物图像识别方法,其特征在于:所述S400包括以下步骤:
将保留的差异区域输入到预训练号的纹理分类模型中,输出漂浮物分类类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344727.0A CN116434062A (zh) | 2023-03-31 | 2023-03-31 | 一种利用ai算法的漂浮物图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344727.0A CN116434062A (zh) | 2023-03-31 | 2023-03-31 | 一种利用ai算法的漂浮物图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116434062A true CN116434062A (zh) | 2023-07-14 |
Family
ID=87091997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310344727.0A Pending CN116434062A (zh) | 2023-03-31 | 2023-03-31 | 一种利用ai算法的漂浮物图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116434062A (zh) |
-
2023
- 2023-03-31 CN CN202310344727.0A patent/CN116434062A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059758B (zh) | 一种基于语义分割的遥感影像养殖塘检测方法 | |
CN109325403B (zh) | 一种基于图像识别的水域污染识别治理方法和系统 | |
CN115409741B (zh) | 一种利用河流表面色差测量泥沙含量的机器视觉识别方法 | |
CN108765443A (zh) | 一种自适应颜色阈值分割的标志增强处理方法 | |
CN105761286A (zh) | 基于多光谱遥感影像的水色异常对象提取方法及系统 | |
CN111179232A (zh) | 基于图像处理的钢筋尺寸检测系统及方法 | |
CN111862143B (zh) | 一种河堤坍塌自动监测方法 | |
CN112330593A (zh) | 基于深度学习网络的建筑物表面裂缝检测方法 | |
CN110726725A (zh) | 一种输电线路金具锈蚀检测方法及装置 | |
CN112149543B (zh) | 一种基于计算机视觉的建筑扬尘识别系统与方法 | |
CN113989257A (zh) | 基于人工智能技术的电力综合管廊沉降裂缝识别方法 | |
CN110348342B (zh) | 一种基于全卷积网络的管道病害图像分割方法 | |
CN110751644B (zh) | 道路表面裂纹检测方法 | |
CN111027446A (zh) | 一种高分辨率影像的海岸线自动提取方法 | |
CN111161224A (zh) | 基于深度学习的铸件内部缺陷分级评估系统及方法 | |
CN114331869B (zh) | 一种坝面裂缝语义分割方法 | |
CN113327255A (zh) | 基于YOLOv3检测定位裁剪及fine-tune的输电线路巡检图像处理方法 | |
CN113065486A (zh) | 适用于河道的漂浮物识别方法与系统、设备、介质 | |
CN109902751B (zh) | 融合卷积神经网络和半字模板匹配的表盘数字字符识别法 | |
CN117315446B (zh) | 一种面向复杂环境下水库溢洪道异常智能识别方法 | |
CN116434062A (zh) | 一种利用ai算法的漂浮物图像识别方法 | |
CN108830834B (zh) | 一种爬索机器人视频缺陷信息自动提取方法 | |
CN111241916A (zh) | 一种交通标志识别模型的建立方法 | |
CN116259008A (zh) | 一种基于计算机视觉的水位实时监测方法 | |
CN114821510A (zh) | 基于改进U-Net网络的车道线检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |