CN117372451A - 基于sam图像分割模型的水体水位监测方法 - Google Patents
基于sam图像分割模型的水体水位监测方法 Download PDFInfo
- Publication number
- CN117372451A CN117372451A CN202311219761.1A CN202311219761A CN117372451A CN 117372451 A CN117372451 A CN 117372451A CN 202311219761 A CN202311219761 A CN 202311219761A CN 117372451 A CN117372451 A CN 117372451A
- Authority
- CN
- China
- Prior art keywords
- image
- water gauge
- water
- water level
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 305
- 238000003709 image segmentation Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012544 monitoring process Methods 0.000 title claims abstract description 37
- 210000000476 body water Anatomy 0.000 title abstract description 6
- 238000012937 correction Methods 0.000 claims abstract description 74
- 230000007246 mechanism Effects 0.000 claims abstract description 68
- 230000011218 segmentation Effects 0.000 claims abstract description 37
- 238000005259 measurement Methods 0.000 claims abstract description 23
- 230000000007 visual effect Effects 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 33
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 9
- 238000012806 monitoring device Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 4
- 238000005215 recombination Methods 0.000 claims description 4
- 230000006798 recombination Effects 0.000 claims description 4
- 230000008521 reorganization Effects 0.000 claims description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000003702 image correction Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 abstract description 4
- 230000007774 longterm Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000005286 illumination Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 244000058871 Echinochloa crus-galli Species 0.000 description 1
- 235000015225 Panicum colonum Nutrition 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012633 leachable Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01F—MEASURING VOLUME, VOLUME FLOW, MASS FLOW OR LIQUID LEVEL; METERING BY VOLUME
- G01F23/00—Indicating or measuring liquid level or level of fluent solid material, e.g. indicating in terms of volume or indicating by means of an alarm
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01F—MEASURING VOLUME, VOLUME FLOW, MASS FLOW OR LIQUID LEVEL; METERING BY VOLUME
- G01F23/00—Indicating or measuring liquid level or level of fluent solid material, e.g. indicating in terms of volume or indicating by means of an alarm
- G01F23/04—Indicating or measuring liquid level or level of fluent solid material, e.g. indicating in terms of volume or indicating by means of an alarm by dip members, e.g. dip-sticks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/30—Assessment of water resources
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Fluid Mechanics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Processing (AREA)
Abstract
本发明涉及水文测验技术领域,尤其涉及一种基于SAM图像分割模型的水体水位监测方法,包括:对采集的水尺图像进行空间校正,得到水尺校正图像;以视觉自注意力机制为框架,建立用于水尺图像分割的SAM图像分割模型;获取水尺校正图像上的提示点信息,并将水尺校正图像和提示点信息输入SAM图像分割模型,得到水尺区域分割结果;建立掩码像素与实测水位之间的水位测量模型,并利用水位测量模型对水尺区域分割结果进行处理,得到测量水位值。本发明通过SAM图像分割模型实现水位的自动监测,解决了现有图像识别水位方法鲁棒性和适用性较差的问题,提高了水位监测的准确性和长期稳定性,降低了监测成本。
Description
技术领域
本发明涉及水文测验技术领域,尤其涉及一种基于SAM图像分割模型的水体水位监测方法。
背景技术
水位测量对于洪水预警和水文预报、水资源管理、水生态保护、水力发电与航运等领域与行业至关重要,传统水位测量需要派遣技术人员前往现场,借助水尺对水位进行读数,这种人工测量方法不仅需要花费大量时间和人员培训成本,而且在地形复杂的流域或洪水季节给水位测量带来了挑战。
近年来,基于图像处理的非接触式水位测量方法显著提高了水文测验的效率及安全性,现有的图像识别水位方法主要分为两种:一种为基于阈值或形态学等图像处理方法,提取出水位标记线,但识别精度受限于观测水域环境条件(光照、阴影、水草等);另一种为基于机器学习方法对水位特征进行提取,实现对水位高度模拟计算的方法,但由于水文观测数据的稀疏性,模型泛化性能往往有限,鲁棒性和适用性较差。
发明内容
本发明提供了一种基于SAM图像分割模型的水体水位监测方法,解决的技术问题是,现有图像识别水位方法鲁棒性和适用性较差。
为解决以上技术问题,本发明提供了一种基于SAM图像分割模型的水体水位监测方法。
第一方面,本发明提供了一种基于SAM图像分割模型的水体水位监测方法,所述方法包括以下步骤:
采集水尺图像,对所述水尺图像进行空间校正,得到水尺校正图像;
以视觉自注意力机制为框架,建立用于水尺图像分割的SAM图像分割模型;
获取所述水尺校正图像上的提示点信息,并将所述水尺校正图像和所述提示点信息输入所述SAM图像分割模型,得到水尺区域分割结果;
建立掩码像素与实测水位之间的水位测量模型,并利用所述水位测量模型对所述水尺区域分割结果进行处理,得到测量水位值。
在进一步的实施方案中,所述对所述水尺图像进行空间校正,得到水尺校正图像的步骤包括:
获取水尺边缘线或中轴线在铅直方向上的平均偏转角度,并根据所述平均偏转角度建立旋转矩阵;
利用所述旋转矩阵将所述水尺图像进行仿射变换,得到旋转校正图像;
对所述旋转校正图像进行畸变校正,生成畸形矫正图像;
利用预先设定的插值算法对所述畸形矫正图像中的缺失值进行插值,得到水尺校正图像。
在进一步的实施方案中,所述SAM图像分割模型包括输入层、输出层以及依次连接在所述输入层与所述输出层之间的编码模块和掩码解码模块,所述编码模块包括与所述掩码解码模块均有连接的图像编码模块和提示点编码模块;
所述图像编码模块包括图像重组向量编码模块、预设数量个图像自注意力机制模块以及两个第一卷积层;每个所述图像自注意力机制模块包括通过残差连接的归一化模块、多头自注意力机制层和第一多层感知器;
所述掩码解码模块包括依次连接的第一解码层、第二解码层和特征输出层,其中,每个所述解码层包括图像交叉注意力机制以及依次连接的信息自注意力机制、信息交叉注意力机制和第二多层感知器,其中,所述图像交叉注意力机制与所述第二多层感知器、所述图像编码模块和信息自注意力机制均有连接,所述图像交叉注意力机制和所述第二多层感知器均与所述特征输出层连接;
所述特征输出层包括顺序连接的融合交叉注意力机制层、第二卷积层和第三多层感知器。
在进一步的实施方案中,所述将所述水尺校正图像和所述提示点信息输入训练好的SAM图像分割模型,得到水尺区域分割结果的步骤包括:
通过所述图像编码模块对所述水尺校正图像进行重组编码,得到水尺图像特征;
通过所述提示点编码模块对所述提示点信息进行叠加编码,生成叠加特征;
采用两个解码层对所述水尺图像特征和所述叠加特征进行解码,得到解码输出特征;其中,所述解码输出特征包括水尺图像输出特征和叠加输出特征;
以所述叠加输出特征为查询向量,将所述叠加输出特征与水尺图像输出特征经过所述融合交叉注意力机制层捕捉外部相关性,并通过所述第二卷积层进行转置卷积,得到最终的水尺图像特征;
将掩码特征从所述叠加输出特征中分离出来,经第三多层感知器调整维度并与最终水尺图像特征相乘,输出水尺区域分割结果。
在进一步的实施方案中,所述通过所述图像编码模块对所述水尺校正图像进行重组编码,得到水尺图像特征,通过所述提示点编码模块对所述提示点信息进行叠加编码,生成叠加特征的步骤包括:
将所述水尺校正图像进行卷积或者线性映射编码后得到子块向量,将所述子块向量与位置向量求和得到图像输入特征,以通过所述图像自注意力机制模块对所述图像输入特征进行编码,得到水尺图像特征;
获取可学习输出特征,并对所述提示点信息进行特征提取,得到提示点特征,将所述可学习输出特征叠加在所述提示点特征上,生成叠加特征;所述可学习输出特征包括交并比特征和掩码特征,交并比特征用于得到最终的水尺区域分割结果的交并比分数。
在进一步的实施方案中,所述采用两个解码层对所述水尺图像特征和所述叠加特征进行解码,得到解码输出特征,包括:
在所述第一解码层中,利用所述信息自注意力机制捕捉所述提示点叠加特征的内部相关性,得到叠加内部更新特征;
以所述叠加内部更新特征为查询向量,通过信息交叉注意力机制捕捉所述叠加内部更新特征与所述水尺图像特征的外部相关性,并将信息交叉注意力机制输出的结果通过多层感知器进行特征变换,得到更新后的叠加特征;
以所述水尺图像特征为查询向量,将所述水尺图像特征与所述更新后的叠加特征经过所述图像交叉注意力机制捕捉外部相关性,得到更新后的水尺图像特征;
按照上述步骤,利用所述第二解码层对更新后的叠加特征和更新后的水尺图像特征进行二次解码,得到解码输出特征。
在进一步的实施方案中,所述水位测量模型为:
S=H-k(ymax-ymin)
式中,S表示测量水位值;H表示水尺量程;k表示回归系数;ymin表示水尺区域分割结果中的有效掩码上边界纵坐标;ymax表示水尺区域分割结果中的有效掩码下边界纵坐标。
第二方面,本发明提供了一种基于SAM图像分割模型的水体水位监测装置,所述装置包括:
图像校正模块,用于采集水尺图像,对所述水尺图像进行空间校正,得到水尺校正图像;
模型构建模块,用于以视觉自注意力机制为框架,建立用于水尺图像分割的SAM图像分割模型;
图像分割模块,用于获取所述水尺校正图像上的提示点信息,并将所述水尺校正图像和所述提示点信息输入所述SAM图像分割模型,得到水尺区域分割结果;
水位测量模块,用于建立掩码像素与实测水位之间的水位测量模型,并利用所述水位测量模型对所述水尺区域分割结果进行处理,得到测量水位值。
本发明提供了一种基于SAM图像分割模型的水体水位监测方法,所述方法包括对水尺图像进行空间校正,得到水尺校正图像;获取水尺校正图像上的提示点信息,并将水尺校正图像和提示点信息输入以视觉自注意力机制为框架的SAM图像分割模型,得到水尺区域分割结果;建立掩码像素与实测水位之间的水位测量模型,并利用水位测量模型对水尺区域分割结果进行处理,得到测量水位值。与现有技术相比,该方法利用以视觉自注意力机制为框架的SAM图像分割模型对水位进行测量,不仅对各种环境或观测角度下的水尺均具有良好的分割识别能力,避免受光照、水草等干扰因素的影响,提高了测量结果的精准度和方法应用的可适应性,而且降低了施工难度和施工成本。
附图说明
图1是本发明实施例提供的基于SAM图像分割模型的水体水位监测方法流程示意图;
图2是本发明实施例提供的带有提示点的水尺图像示意图;
图3是本发明实施例提供的SAM图像分割模型结构示意图;
图4是本发明实施例提供的水尺区域分割结果中的二值化掩码示意图;
图5是本发明实施例提供的SAM图像分割模型输出的带有提示点和掩码的水尺图像示意图;
图6是本发明实施例提供的基于SAM图像分割模型的水体水位监测装置框图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本发明的限定,包括附图仅供参考和说明使用,不构成对本发明专利保护范围的限制,因为在不脱离本发明精神和范围基础上,可以对本发明进行许多改变。
参考图1,本发明实施例提供了一种基于SAM图像分割模型的水体水位监测方法,如图1所示,该方法包括以下步骤:
S1.采集水尺图像,对所述水尺图像进行空间校正,得到水尺校正图像。
本实施例在目标水域垂直安装水尺,并在距离水尺预设距离且观测较为容易的位置布置一台监控摄像机,调整监控摄像机的角度,以使镜头正对水尺,查看监控摄像机拍摄的画面,保证水尺全长均位于画面中且尽量位于画面中心,监控人员从画面中能清晰看到水尺刻度,并较为准确地对水位进行读数,经过上述步骤的调整之后,切换监控摄像机的工作模式为照片拍摄模式,设置拍摄间隔为10分钟,监控摄像机定时拍摄水尺图片,并同步上传至云端,传入图像处理模块进行水位计算,监控人员或抽查人员可从云端查看、下载水尺图片。
由于采集到的水尺图像存在偏转、畸变等问题,因此本实施例需要先对图像进行空间校正,在本实施例中,所述对所述水尺图像进行空间校正,得到水尺校正图像的步骤包括:
获取水尺边缘线或中轴线在铅直方向上的平均偏转角度,并根据所述平均偏转角度建立旋转矩阵;
利用所述旋转矩阵将所述水尺图像进行仿射变换,旋转至铅直方向,得到旋转校正图像;
对所述旋转校正图像进行畸变校正,生成畸形矫正图像;
利用预先设定的插值算法对所述畸形矫正图像中的缺失值进行插值,得到水尺校正图像。
需要说明的是,由于倾斜校正后的旋转校正图像仍存在透视畸变,因此,本实施例需要根据摄像机内部的畸变参数进行畸变校正,畸变校正的计算公式为:
式中,(u,v)表示旋转校正图像的像素点坐标;(x′,y′)表示畸变矫正图像的像素点坐标;A表示空间透视变换矩阵,由相机的内参矩阵和畸变系数确定;aij表示空间透视变换矩阵中的元素。
水尺图像经过畸变校正后,若部分区域存在像素缺失值的情况,本实施例将距离其最近的非缺值点的像素值复制给该像素点或采用拉格朗日插值,得到缺值修补后的图像。
S2.以视觉自注意力机制为框架,建立用于水尺图像分割的SAM图像分割模型。
S3.获取所述水尺校正图像上的提示点信息,并将所述水尺校正图像和所述提示点信息输入所述SAM图像分割模型,得到水尺区域分割结果。
图3为SAM图像分割模型结构示意图,在本实施例中,所述SAM(Segment AnythingModel)图像分割模型包括输入层、输出层以及依次连接在所述输入层与所述输出层之间的编码模块和掩码解码模块,所述编码模块包括与所述掩码解码模块均有连接的图像编码模块和提示点编码模块;所述图像编码模块包括图像重组向量编码模块、预设数量个图像自注意力机制模块以及两个第一卷积层;每个所述图像自注意力机制模块包括通过残差连接的归一化模块、多头自注意力机制层和第一多层感知器;所述掩码解码模块包括依次连接的第一解码层、第二解码层和特征输出层,其中,每个所述解码层包括图像交叉注意力机制以及依次连接的信息自注意力机制、信息交叉注意力机制和第二多层感知器,其中,所述图像交叉注意力机制与所述第二多层感知器、所述图像编码模块和自适应注意力机制均有连接,所述图像交叉注意力机制和所述第二多层感知器均与所述特征输出层连接;所述特征输出层包括顺序连接的融合交叉注意力机制层、第二卷积层和第三多层感知器。
在本实施例中,所述将所述水尺校正图像和所述提示点信息输入所构SAM图像分割模型,得到水尺区域分割结果的步骤包括:
通过所述图像编码模块对所述水尺校正图像进行重组编码,得到水尺图像特征;
通过所述提示点编码模块对所述提示点信息进行叠加编码,生成叠加特征;
采用两个解码层对所述水尺图像特征和所述叠加特征进行解码,得到解码输出特征;其中,所述解码输出特征包括水尺图像输出特征和叠加输出特征;
具体地,以所述叠加输出特征为查询向量,将所述叠加输出特征与水尺图像输出特征经过所述融合交叉注意力机制层捕捉外部相关性,并通过所述第二卷积层进行转置卷积,得到最终的水尺图像特征,将掩码特征从所述叠加输出特征中分离出来,经第三多层感知器调整维度并与最终水尺图像特征相乘,输出水尺区域分割结果,交并比特征用于得到最终的水尺区域分割结果的交并比分数。
在本实施例中,所述通过所述图像编码模块对所述水尺校正图像进行重组编码,得到水尺图像特征,通过所述提示点编码模块对所述提示点信息进行叠加编码,生成叠加特征的步骤包括:
将所述水尺校正图像进行卷积或者线性映射编码后得到子块向量,将所述子块向量与位置向量求和得到图像输入特征,以通过所述图像自注意力机制模块对所述图像输入特征进行编码,得到水尺图像特征;
获取可学习输出特征,并对所述提示点信息进行特征提取,得到提示点特征,将可学习输出特征叠加在所述提示点特征上,生成叠加特征;所述可学习输出特征包括交并比特征和掩码特征。
在本实施例中,所述采用两个解码层对所述水尺图像特征和所述叠加特征进行解码,得到解码输出特征,包括:
在所述第一解码层中,利用所述信息自注意力机制捕捉所述叠加特征的内部相关性,得到叠加内部更新特征;
以所述叠加内部更新特征为查询向量,通过信息交叉注意力机制捕捉所述叠加内部更新特征与所述水尺图像特征的外部相关性,并将信息交叉注意力机制输出的结果通过多层感知器进行特征变换,得到更新后的叠加特征;
以所述水尺图像特征为查询向量,将所述水尺图像特征与所述更新后的叠加特征经过所述图像交叉注意力机制捕捉外部相关性,得到更新后的水尺图像特征;
按照上述步骤,利用所述第二解码层对更新后的叠加特征和更新后的水尺图像特征进行二次解码,得到解码输出特征。
具体地,如图2所示,本实施例在水尺校正图像上标注四个提示点,输入SAM图像分割模型,输出得到水面以上的水尺区域分割结果,如图3所示。区别于传统的卷积神经网络,SAM图像分割模型已经过数据引擎预训练,无需输入特定实例再次训练,即可在大多数场景实现较好的图像分割效果,在本实施例中,SAM图像分割模型以VIT(Vision Transformer,视觉自注意力机制)模型为框架,引入提示工程技术实现目标掩码的精准分割,在本实施例中,水尺校正图像大小为3×3648×2736,输入SAM图像分割模型后被分割为N=38988个16×16大小的子块,对各个子块采用卷积或者线性投影的方法编码成向量,通道数由3变为768,子块图像按照一定的次序与规则可拼接成整幅图像,因此子块图像在全图中的位置对于模型特征提取至关重要,本实施例利用Bert模型对子图位置进行编码,将位置向量与子块向量求和得到图像输入特征,图像输入特征经过16个图像自注意力机制模块(Transformer模块),每个Transformer模块由两个归一化层、一个多头自注意力机制层和一个第一多层感知器残差连接得到,最后经过两个卷积层将维数降到256,输出256×64×64的特征张量m16,实现图像的编码,Transformer模块的计算过程如下式所示:
m'l=MSA(LN(ml-1))+ml-1
ml=MLP(LN(m′l))+m′l
式中,表示第N个图像字块的特征向量集;xclass表示分类向量,其用于执行图像分类任务;Zpos表示图像子块的位置向量集;m0表示第一个Transformer模块的图像输入特征;ml表示第l个Transformer模块计算得到的特征;ml′表示多头自注意力机制层输出的结果;MSA表示多头自注意力机制层;LN表示归一化函数;MLP表示第一多层感知器。
SAM图像分割模型根据水尺图像特征与提示点的关联性实现对目标物体的分割,在本实施例中,提示点分为前景提示点和背景提示点,前景提示点为分割区域的代表点,标注了模型重点应关注的区域,背景提示点标注了模型应避免关注或者忽略的区域,提示点数量与位置不局限于本发明实施例,由本领域技术人员在具体实施过程中根据分割目标的特点、计算机性能进行尝试,以得到的提示点能高效地完成目标区域分割任务为目标进行提示点选取,本实施例优先在水尺校正图像上标注三个前景提示点,三个前景提示点的坐标分别为(1190,1118)、(1076,715)和(1095,1762),在图2中表示为从上到下三个五角星,同时由于水尺在水面产生倒影,会影响图像分割效果,为此,在倒影区域标注一个背景提示点,坐标为(1114,3041),在图2中表示为最下端的五角星,SAM图像分割模型对所有提示点的位置坐标和背景指示进行编码,其中,背景指示指的是该提示点是前景提示点(输入为1)还是背景提示点(输入为0),提示点编码后的特征大小为N×256。
执行解码步骤:本实施例将一组可学习输出特征(类似于VIT模型的类别特征xclass)叠加在提示点特征上,可学习输出特征由两部分组成:一是交并比(IoU)特征,SAM图像分割模型预测的掩码与真实的掩码存在一个交并比,该交并比与SAM图像分割模型计算得到的交并比之间的均方误差构成该特征的损失函数;另一个是掩码特征,受交叉熵损失(focal loss)和骰子损失(dice loss)按20:1的加权组合监督,叠加后得到的叠加特征经过信息自注意力机制计算寻找内部相关性,通过softmax函数计算:
δ=Bv
式中,B表示权重矩阵;q表示查询向量;k表示被查询向量,kT对k转置以满足矩阵相乘的要求;Dh表示特征维度;v表示值向量;δ表示叠加内部更新特征,所有变量在训练过程中不断更新。
然后,本实施例进行解码过程,解码过程具体为将所述叠加内部更新特征作为查询向量q,并将其与水尺图像特征经过信息交叉注意力机制寻找外部相关性,更新叠加内部更新特征并经过多层感知器网络实现特征变换,得到更新后的叠加特征;接着,本实施例以水尺图像特征作为查询向量q,与更新后的叠加特征经过图像交叉注意力机制实现自我更新。重复解码过程,在通过第二解码层解码之后,第二解码层输出解码输出特征;其中,所述解码输出特征包括水尺图像输出特征和叠加输出特征;最后,本实施例以叠加输出特征为查询向量q,再执行一次交叉注意力计算,即,将所述叠加输出特征与水尺图像输出特征经过所述融合交叉注意力机制层捕捉外部相关性,并通过所述第二卷积层进行转置卷积,得到最终的水尺图像特征。本实施例对更新后的水尺图像特征使用大小为2、步长为2的卷积核进行两次转置卷积,特征尺寸上采样至原来的4倍,得到最终的水尺图像特征,需要说明的是,为防止信息丢失,每一次注意力机制和多层感知器计算均有残差连接。
需要说明的是,水尺图像特征内部进行自注意力计算为内部关联性探索,比如:图像的第一个子块和第二个子块的关联性,内部关联性主要用于编码过程,由于第二个子块是接在第一个子块的后面,对第二个子块编码需要考虑第一个子块的特点;图像特征与提示点信息进行交叉注意力计算就是外部关联性探索,主要用于解码过程,解码过程中,遍历每一个子块,计算提示点与该子块特征,若相关性大于阈值,则为1,小于则为0。
本实施例将水尺校正图像和四个提示点的提示点信息输入SAM图像分割模型,SAM图像分割模型输出置信度最高的掩码,如图4所示,掩码为二值化矩阵,水尺区域为1,背景区域为0;带有掩码和提示点的水尺图像如图5所示;需要说明的是,掩码特征从叠加输出特征中分离出来,经过多层感知器调整掩码特征维度与图像特征一致,两者相乘得到目标掩码,叠加输出特征中的交并比特征则生成对掩码的交并比分数预测,训练过程中模型依据真实结果对预测结果进行监督,反向传播,不断更新参数。
S4.建立掩码像素与实测水位之间的水位测量模型,并利用所述水位测量模型对所述水尺区域分割结果进行处理,得到测量水位值;在本实施例中,所述水位测量模型为:
S=H-k(ymax-ymin)
式中,S表示测量水位值;H表示水尺量程;k表示回归系数;ymin表示水尺区域分割结果中的有效掩码上边界纵坐标;ymax表示水尺区域分割结果中的有效掩码下边界纵坐标。
对于水尺区域分割结果,本实施例先对水尺区域分割结果中的掩码判断是否有效,具体为对水尺区域分割结果中的掩码矩阵计算每一行元素之和,并将每一行元素之和与预先设置的掩码阈值进行比较,若大于掩码阈值,则判断该行的元素为有效掩码,反之则为无效掩码,本实施例通过掩码阈值实现对无效掩码的过滤,在本实施例中,由于水尺在图像中的平均宽度为207像素,因此,设定掩码阈值为100,本实施例通过有效掩码的高度计算出图像中水尺沿高度方向占据的像素点数目:有效掩码上边界的纵坐标为ymin,下边界(与水面的交线)的纵坐标为ymax,像素点数目为(ymax-ymin),通过水尺刻度线对水位进行读数,建立掩码像素与真实水位之间的线性关系,即水位测量模型,比如:本实施例测量到水尺量程为100cm,掩码沿高度方向占据2164个像素点,即可得到以下真实水位值计算公式:
S=100-0.0377×npix
式中,npix表示掩码占据的像素高度。
本发明实施例提供了一种基于SAM图像分割模型的水体水位监测方法,所述方法通过以视觉自注意力机制为框架建立的SAM图像分割模型,得到水尺区域分割结果;建立掩码像素与实测水位之间的水位测量模型,并利用水位测量模型对水尺区域分割结果进行处理,得到测量水位值。相较于传统人工监测水位的方法,采用本实施例提出的水体水位监测方法,只需输入监控摄像头拍摄的水尺图像,即可输出图像对应的水位值,不仅可以实现任何水域水位无间断、快速、自动化监测,降低了检测人员的工作强度,而且对各种环境或观测角度下的水位均具有优越的识别性能,显著降低了光照、水草等干扰因素的影响,提高了水位监测结果的精准度和稳定性。
需要说明的是,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在一个实施例中,如图6所示,本发明实施例提供了一种基于SAM图像分割模型的水体水位监测装置,所述装置包括:
图像校正模块101,用于采集水尺图像,对所述水尺图像进行空间校正,得到水尺校正图像;
模型构建模块102,用于以视觉自注意力机制为框架,建立用于水尺图像分割的SAM图像分割模型;
图像分割模块103,用于获取所述水尺校正图像上的提示点信息,并将所述水尺校正图像和所述提示点信息输入所述SAM图像分割模型,得到水尺区域分割结果;
水位测量模块104,用于建立掩码像素与实测水位之间的水位测量模型,并利用所述水位测量模型对所述水尺区域分割结果进行处理,得到测量水位值。
关于一种基于SAM图像分割模型的水体水位监测装置的具体限定可以参见上述对于一种基于SAM图像分割模型的水体水位监测方法的限定,此处不再赘述。本领域普通技术人员可以意识到,结合本申请所公开的实施例描述的各个模块和步骤,能够以硬件、软件或者两者结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本发明实施例提供了一种基于SAM图像分割模型的水体水位监测装置,所述装置通过SAM图像分割模型和水位测量模型实现了非接触式水位监测,能够高精度识别当前水位高度,避免出现传统水位监测方式易受光线影响,导致水位监测误差较大的情况,具有改造工程量小、稳定性强、适用范围广等特点,可实现大规模推广应用。
以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。
Claims (8)
1.一种基于SAM图像分割模型的水体水位监测方法,其特征在于,包括以下步骤:
采集水尺图像,对所述水尺图像进行空间校正,得到水尺校正图像;
以视觉自注意力机制为框架,建立用于水尺图像分割的SAM图像分割模型;
获取所述水尺校正图像上的提示点信息,并将所述水尺校正图像和所述提示点信息输入所述SAM图像分割模型,得到水尺区域分割结果;
建立掩码像素与实测水位之间的水位测量模型,并利用所述水位测量模型对所述水尺区域分割结果进行处理,得到测量水位值。
2.如权利要求1所述的一种基于SAM图像分割模型的水体水位监测方法,其特征在于,所述对所述水尺图像进行空间校正,得到水尺校正图像的步骤包括:
获取水尺边缘线或中轴线在铅直方向上的平均偏转角度,并根据所述平均偏转角度建立旋转矩阵;
利用所述旋转矩阵将所述水尺图像进行仿射变换,得到旋转校正图像;
对所述旋转校正图像进行畸变校正,生成畸形矫正图像;
利用预先设定的插值算法对所述畸形矫正图像中的缺失值进行插值,得到水尺校正图像。
3.如权利要求1所述的一种基于SAM图像分割模型的水体水位监测方法,其特征在于:所述SAM图像分割模型包括输入层、输出层以及依次连接在所述输入层与所述输出层之间的编码模块和掩码解码模块,所述编码模块包括与所述掩码解码模块均有连接的图像编码模块和提示点编码模块;
所述图像编码模块包括图像重组向量编码模块、预设数量个图像自注意力机制模块以及两个第一卷积层;每个所述图像自注意力机制模块包括通过残差连接的归一化模块、多头自注意力机制层和第一多层感知器;
所述掩码解码模块包括依次连接的第一解码层、第二解码层和特征输出层,其中,每个所述解码层包括图像交叉注意力机制以及依次连接的信息自注意力机制、信息交叉注意力机制和第二多层感知器,其中,所述图像交叉注意力机制与所述第二多层感知器、所述图像编码模块和信息自注意力机制均有连接,所述图像交叉注意力机制和所述第二多层感知器均与所述特征输出层连接;
所述特征输出层包括顺序连接的融合交叉注意力机制层、第二卷积层和第三多层感知器。
4.如权利要求3所述的一种基于SAM图像分割模型的水体水位监测方法,其特征在于,所述将所述水尺校正图像和所述提示点信息输入训练好的SAM图像分割模型,得到水尺区域分割结果的步骤包括:
通过所述图像编码模块对所述水尺校正图像进行重组编码,得到水尺图像特征;
通过所述提示点编码模块对所述提示点信息进行叠加编码,生成叠加特征;
采用两个解码层对所述水尺图像特征和所述叠加特征进行解码,得到解码输出特征;其中,所述解码输出特征包括水尺图像输出特征和叠加输出特征;
以所述叠加输出特征为查询向量,将所述叠加输出特征与水尺图像输出特征经过所述融合交叉注意力机制层捕捉外部相关性,并通过所述第二卷积层进行转置卷积,得到最终的水尺图像特征;
将掩码特征从所述叠加输出特征中分离出来,经第三多层感知器调整维度并与最终的水尺图像特征相乘,输出水尺区域分割结果。
5.如权利要求4所述的一种基于SAM图像分割模型的水体水位监测方法,其特征在于,所述通过所述图像编码模块对所述水尺校正图像进行重组编码,得到水尺图像特征,通过所述提示点编码模块对所述提示点信息进行叠加编码,生成叠加特征的步骤包括:
将所述水尺校正图像进行卷积或者线性映射编码后得到子块向量,将所述子块向量与位置向量求和得到图像输入特征,以通过所述图像自注意力机制模块对所述图像输入特征进行编码,得到水尺图像特征;
获取可学习输出特征,并对所述提示点信息进行特征提取,得到提示点特征,将所述可学习输出特征叠加在所述提示点特征上,生成叠加特征;所述可学习输出特征包括交并比特征和掩码特征,交并比特征用于得到最终的水尺区域分割结果的交并比分数。
6.如权利要求4所述的一种基于SAM图像分割模型的水体水位监测方法,其特征在于,所述采用两个解码层对所述水尺图像特征和所述叠加特征进行解码,得到解码输出特征,包括:
在所述第一解码层中,利用所述信息自注意力机制捕捉所述叠加特征的内部相关性,得到叠加内部更新特征;
以所述叠加内部更新特征为查询向量,通过信息交叉注意力机制捕捉所述叠加内部更新特征与所述水尺图像特征的外部相关性,并将信息交叉注意力机制输出的结果通过多层感知器进行特征变换,得到更新后的叠加特征;
以所述水尺图像特征为查询向量,将所述水尺图像特征与所述更新后的叠加特征经过所述图像交叉注意力机制捕捉外部相关性,得到更新后的水尺图像特征;
按照上述步骤,利用所述第二解码层对更新后的叠加特征和更新后的水尺图像特征进行二次解码,得到解码输出特征。
7.如权利要求1所述的一种基于SAM图像分割模型的水体水位监测方法,其特征在于,所述水位测量模型为:
式中,S表示测量水位值;H表示水尺量程;k表示回归系数;ymin表示水尺区域分割结果中的有效掩码上边界纵坐标;ymax表示水尺区域分割结果中的有效掩码下边界纵坐标。
8.一种基于SAM图像分割模型的水体水位监测装置,其特征在于,所述装置包括:
图像校正模块,用于采集水尺图像,对所述水尺图像进行空间校正,得到水尺校正图像;
模型构建模块,用于以视觉自注意力机制为框架,建立用于水尺图像分割的SAM图像分割模型;
图像分割模块,用于获取所述水尺校正图像上的提示点信息,并将所述水尺校正图像和所述提示点信息输入所述SAM图像分割模型,得到水尺区域分割结果;
水位测量模块,用于建立掩码像素与实测水位之间的水位测量模型,并利用所述水位测量模型对所述水尺区域分割结果进行处理,得到测量水位值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311219761.1A CN117372451A (zh) | 2023-09-20 | 2023-09-20 | 基于sam图像分割模型的水体水位监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311219761.1A CN117372451A (zh) | 2023-09-20 | 2023-09-20 | 基于sam图像分割模型的水体水位监测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117372451A true CN117372451A (zh) | 2024-01-09 |
Family
ID=89406815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311219761.1A Pending CN117372451A (zh) | 2023-09-20 | 2023-09-20 | 基于sam图像分割模型的水体水位监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117372451A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118072378A (zh) * | 2024-03-11 | 2024-05-24 | 珠海全一科技有限公司 | 一种基于sam基础模型的动态决策图像分割方法 |
CN118411675A (zh) * | 2024-06-27 | 2024-07-30 | 武汉大水云科技有限公司 | 一种基于sam大模型的水位识别方法 |
CN118470219A (zh) * | 2024-07-10 | 2024-08-09 | 中国海洋大学 | 一种基于无标定图像的多视角三维重建方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140350905A1 (en) * | 2011-12-15 | 2014-11-27 | Statoil Petroleum As | Asep+d method: identifying anomalous areas of the earth's lower crust |
CN109815865A (zh) * | 2019-01-11 | 2019-05-28 | 江河瑞通(北京)技术有限公司 | 一种基于虚拟水尺的水位识别方法及系统 |
CN112766274A (zh) * | 2021-02-01 | 2021-05-07 | 长沙市盛唐科技有限公司 | 一种基于Mask RCNN算法的水尺图像水位自动读数方法及系统 |
CN115861616A (zh) * | 2022-12-09 | 2023-03-28 | 复旦大学 | 面向医学图像序列的语义分割系统 |
CN116258933A (zh) * | 2023-03-13 | 2023-06-13 | 西安电子科技大学 | 基于全局信息感知的医学图像分割装置 |
CN116415730A (zh) * | 2023-04-12 | 2023-07-11 | 安徽大学 | 一种预测水位的融合自注意力机制时空深度学习模型 |
CN116542986A (zh) * | 2023-04-17 | 2023-08-04 | 重庆理工大学 | 一种基于BFTransNet混合网络的肠胃MRI图像分割方法 |
CN116597916A (zh) * | 2023-06-15 | 2023-08-15 | 江苏运动健康研究院 | 一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法 |
-
2023
- 2023-09-20 CN CN202311219761.1A patent/CN117372451A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140350905A1 (en) * | 2011-12-15 | 2014-11-27 | Statoil Petroleum As | Asep+d method: identifying anomalous areas of the earth's lower crust |
CN109815865A (zh) * | 2019-01-11 | 2019-05-28 | 江河瑞通(北京)技术有限公司 | 一种基于虚拟水尺的水位识别方法及系统 |
CN112766274A (zh) * | 2021-02-01 | 2021-05-07 | 长沙市盛唐科技有限公司 | 一种基于Mask RCNN算法的水尺图像水位自动读数方法及系统 |
CN115861616A (zh) * | 2022-12-09 | 2023-03-28 | 复旦大学 | 面向医学图像序列的语义分割系统 |
CN116258933A (zh) * | 2023-03-13 | 2023-06-13 | 西安电子科技大学 | 基于全局信息感知的医学图像分割装置 |
CN116415730A (zh) * | 2023-04-12 | 2023-07-11 | 安徽大学 | 一种预测水位的融合自注意力机制时空深度学习模型 |
CN116542986A (zh) * | 2023-04-17 | 2023-08-04 | 重庆理工大学 | 一种基于BFTransNet混合网络的肠胃MRI图像分割方法 |
CN116597916A (zh) * | 2023-06-15 | 2023-08-15 | 江苏运动健康研究院 | 一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法 |
Non-Patent Citations (3)
Title |
---|
ALEXANDER KIRILLOV等: "Segment Anything", ARXIV, 5 April 2023 (2023-04-05), pages 4 - 16 * |
ALEXEY DOSOVITSKIY等: "AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE", ARXIV, 3 June 2021 (2021-06-03), pages 3 * |
李志峰;张家硕;洪宇;尉桢楷;姚建民;: "融合覆盖机制的多模态神经机器翻译", 中文信息学报, no. 03, 15 March 2020 (2020-03-15) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118072378A (zh) * | 2024-03-11 | 2024-05-24 | 珠海全一科技有限公司 | 一种基于sam基础模型的动态决策图像分割方法 |
CN118411675A (zh) * | 2024-06-27 | 2024-07-30 | 武汉大水云科技有限公司 | 一种基于sam大模型的水位识别方法 |
CN118411675B (zh) * | 2024-06-27 | 2024-09-06 | 武汉大水云科技有限公司 | 一种基于sam大模型的水位识别方法 |
CN118470219A (zh) * | 2024-07-10 | 2024-08-09 | 中国海洋大学 | 一种基于无标定图像的多视角三维重建方法和系统 |
CN118470219B (zh) * | 2024-07-10 | 2024-09-03 | 中国海洋大学 | 一种基于无标定图像的多视角三维重建方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117372451A (zh) | 基于sam图像分割模型的水体水位监测方法 | |
CN112766274B (zh) | 一种基于Mask RCNN算法的水尺图像水位自动读数方法及系统 | |
CN108564065B (zh) | 一种基于ssd的电缆隧道明火识别方法 | |
CN112347859A (zh) | 一种光学遥感图像显著性目标检测方法 | |
CN111986240A (zh) | 基于可见光和热成像数据融合的落水人员检测方法及系统 | |
CN110634137A (zh) | 一种基于视觉感知的桥梁变形的监测方法、装置及设备 | |
CN113628261B (zh) | 一种电力巡检场景下的红外与可见光图像配准方法 | |
CN109341691A (zh) | 基于图标识别的智能室内定位系统及其定位方法 | |
CN113240747B (zh) | 一种基于计算机视觉的户外结构振动位移自动化监测方法 | |
CN113344852A (zh) | 一种电力场景通用物品的目标检测方法、装置及存储介质 | |
CN109741240A (zh) | 一种基于层次聚类的多平面图像拼接方法 | |
CN117346846B (zh) | 一种可自动修正的量水堰流量摄影监测方法及装置 | |
CN113627427B (zh) | 一种基于图像检测技术的仪器仪表读数方法及系统 | |
CN116625258A (zh) | 链条间距测量系统及链条间距测量方法 | |
CN112577473A (zh) | 一种双时相的高分辨率遥感影像变化检测算法 | |
CN114549970B (zh) | 融合全局细粒度信息的夜间小目标果实检测方法及系统 | |
CN116843756A (zh) | 一种基于计算机视觉的望远镜位姿监测方法 | |
CN115471777A (zh) | 基于视频识别的精细化水流速度场获取方法和系统 | |
CN114792345A (zh) | 一种基于单目结构光系统的标定方法 | |
CN116912675B (zh) | 一种基于特征迁移的水下目标检测方法及系统 | |
CN116503398B (zh) | 绝缘子污闪检测方法、装置、电子设备及存储介质 | |
CN114299153A (zh) | 一种超大电力设备的相机阵列同步标定方法及系统 | |
CN117877011A (zh) | 一种基于神经网络的仪表动态追踪与识别方法和系统 | |
CN117576461A (zh) | 一种用于变电站场景的语义理解方法、介质及系统 | |
CN112001964A (zh) | 一种基于深度学习的洪水演进过程淹没范围测量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |