CN117274316B - 一种河流表面流速的估计方法、装置、设备及存储介质 - Google Patents
一种河流表面流速的估计方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117274316B CN117274316B CN202311440505.5A CN202311440505A CN117274316B CN 117274316 B CN117274316 B CN 117274316B CN 202311440505 A CN202311440505 A CN 202311440505A CN 117274316 B CN117274316 B CN 117274316B
- Authority
- CN
- China
- Prior art keywords
- image
- features
- images
- flow velocity
- hidden
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000010586 diagram Methods 0.000 claims description 93
- 239000013598 vector Substances 0.000 claims description 52
- 230000004927 fusion Effects 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000004645 scanning capacitance microscopy Methods 0.000 claims description 20
- 238000006073 displacement reaction Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 15
- 230000017105 transposition Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 8
- 238000000691 measurement method Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 239000012530 fluid Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种河流表面流速的估计方法、装置、设备及存储介质,方法包括:获取双目相机对河流表面拍摄得到的多组图像,每组图像包括同一时间戳下拍摄得到的左目图和右目图;将各组图像依次输入至预先构建的细节增强模型,利用细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,进而得到多组分辨率达到设定阈值的图像,作为高清图像集合;将高清图像集合输入至预先构建的流速估计模型,利用流速估计模型提取高清图像集合的隐特征,根据隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速。本申请实现了准确地确定河流表面的流速,可广泛应用于图像处理和流速估计技术领域。
Description
技术领域
本申请涉及图像处理和流速估计技术领域,尤其是一种河流表面流速的估计方法、装置、设备及存储介质。
背景技术
目前常见流速测量方法包括:1)浮标测流法:主要应用在山溪性河流和漂浮物多、洪峰涨落急剧的洪水测验,具有“选材简单、价格低、投放速度快、易操作、易成活、稳定性强、测流速度快、安全性能好”等优点。浮标系数是影响该方法测验精度的关键,其与河流的水利因素、天气因素、浮标材质等密切相关。2)声学多普勒测流仪法:多普勒超声波流量计是是利用声波在流体中传播的多普勒效应,通过测定流体中运动粒子散射声波的多普勒频移,即可得到流体的速度,结合内置压力式水位计,利用速度面积法,即可测量液体的流量。适合于明渠、河道及难以建造标准断面的流速流量测量以及于各种满管和非满管明渠流速流量测量。3)雷达流速仪流速测量法:基于多普勒效应,将发射电磁波的雷达探头斜向下发出一束雷达波,雷达波在照射到水体表面反射,由于多普勒效应,发出去和雷达波和接收到的雷达波会产生多普勒频移Δf,多普勒频移Δf正比于流速。通过测量多普勒频移Δf即可测量出流体的流速。
现有的基于图像的表面流速估计方法,主要存在以下问题:1.传统流速测量方法存在安装设备实施测量的难度大,设备成本高,且维护难度大等问题。2.现有基于视觉的流速测量方法,主要是基于图像表面二维特征进行匹配,当水面较为平静缺乏特征细节信息时,测量精度难以保证。3.现有基于视觉分析的流速测量方法中,主要采用单目相机将进行测量。而单目相机缺乏距离感知能力,因此需要对每台设备使用前在安装现场对每个断面分别标定,否则无法将像素坐标转换为世界坐标。同时单目相机中,容易收到前景干扰(如浪花、降雨等),从而产生错误计算结果。4.对于基于光流的视频流速测量方法中,训练时无法对每个像素点进行标注,大多通过2D图像变换等方式进行模拟,容易导致结果产生较大误差。
发明内容
有鉴于此,本申请提供一种河流表面流速的估计方法、装置、设备及存储介质,以准确地确定河流表面的流速。
本申请的一方面提供了一种河流表面流速的估计方法,包括:
获取双目相机对河流表面拍摄得到的多组图像,每组图像包括同一时间戳下拍摄得到的左目图和右目图;
将各组图像依次输入至预先构建的细节增强模型,利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,进而得到多组分辨率达到设定阈值的图像,作为高清图像集合;
将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速。
可选地,所述利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,包括:
利用所述细节增强模型中的卷积层、NAFBlock层、SCAM层和Pixel Shuffle层生成分辨率达到设定阈值的图像,作为高清图像;
其中,所述NAFBlock层用于提取单个图像的特征;
所述SCAM层用于输出从左目图相对于右目图的第一特征映射并将所述第一特征映射与对应的右目图的特征进行融合,也用于输出从右目图相对于左目图的第二特征映射并将所述第二特征映射与对应的左目图的特征进行融合;
所述Pixel Shuffle层用于将经过所述SCAM层融合得到的特征并结合对应的左目图或右目图进行上采样,生成所述高清图像。
可选地,所述利用所述细节增强模型中的卷积层、NAFBlock层、SCAM层和PixelShuffle层生成分辨率达到设定阈值的图像,包括:
将每组图像的左目图和右目图分别依次经过一个所述卷积层、一个所述NAFBlock层、多个所述SCAM层、一个所述NAFBlock层、一个所述SCAM层、一个所述卷积层以及一个所述Pixel Shuffle层进行处理,进而生成分辨率达到设定阈值的图像。
可选地,所述输出从左目图相对于右目图的第一特征映射并将所述第一特征映射与对应的右目图的特征进行融合,包括:
将左目图的特征对应的特征矩阵作为查询向量,将右目图的特征对应的特征矩阵作为键向量,将查询向量和键向量经层标准化和线性化,且对键向量进行转置后,对查询向量和键向量进行点积操作并堆叠,得到堆叠特征;将堆叠特征转置再经过softmax层与左目图线性化后的特征矩阵进行点积操作,得到的结果再与右目图的原始特征相加,以融合左目图和右目图的特征;
所述输出从右目图相对于左目图的第二特征映射并将所述第二特征映射与对应的左目图的特征进行融合,包括:
将右目图的特征对应的特征矩阵作为查询向量,将左目图的特征对应的特征矩阵作为键向量,将查询向量和键向量经层标准化和线性化,且对键向量进行转置后,对查询向量和键向量进行点积操作并堆叠,得到堆叠特征;将堆叠特征经转置再经过softmax层与右目图线性化后的特征矩阵进行点积操作,得到的结果再与左目图的原始特征相加,以融合左目图和右目图的特征。
可选地,所述将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速,包括:
利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征,得到两组隐特征,每组隐特征包括m个隐特征;
将每组提取得到的m个隐特征分别输入运动预测模块,利用所述运动预测模块分别推演得到第m+1张图像的运动增强特征和第m+2张图像的运动增强特征;
将每组提取得到的m个隐特征分别输入所述流速估计模型中的先验模型模块,利用所述先验模型模块分别推演得到第m+1张图像的图像增强特征和第m+2张图像的图像增强特征;
将第m+1张图像的运动增强特征与第m+1张图像的图像增强特征融合,得到第一融合特征;将第m+2张图像的运动增强特征与第m+2张图像的图像增强特征融合,得到第二融合特征;
利用所述流速估计模型中的VQ-VAE解码器分别将所述第一融合特征和所述第二融合特征还原为第一目标图像和第二目标图像;
对所述第一目标图像和所述第二目标图像进行关键点提取和匹配,得到若干个关键点及对应的相对像素位移;
根据双目测距公式和所述双目相机的设置参数将所述相对像素位移转换为实际的物理位移与河流表面的流速;
将第3张至第m+3张图像作为新的前m张图像,将第4张至第m+4张图像作为新的第2张至第m+1张图像,执行所述利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征的步骤,直至所述高清图像集合中的所有图像被处理完成,得到多个河流表面的流速。
可选地,所述利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征,得到两组隐特征,每组隐特征包括m个隐特征,包括:
利用所述VQ-VAE编码器对包括m张图像的每组图像序列在时空维度使用3D卷积下采样,得到对应的图像特征;
利用所述VQ-VAE编码器中的残差注意力模块压缩所述图像特征;
所述方法还包括:
利用所述VQ-VAE编码器中的编码表获得离散化的隐特征;
利用所述离散化的隐特征训练所述先验模型模块,以根据训练后的先验模型模块获得所述图像增强特征;
所述利用所述流速估计模型中的VQ-VAE解码器分别将所述第一融合特征和所述第二融合特征还原为第一目标图像和第二目标图像,包括:
将离散化的第一融合特征和第二融合特征经过残差注意力模块进行处理,再经过3D转置卷积进行上采样,以还原得到第一目标图像和第二目标图像。
可选地,所述将每组提取得到的m个隐特征分别输入运动预测模块,利用所述运动预测模块分别推演得到第m+1张图像的运动增强特征和第m+2张图像的运动增强特征,包括:
每个时刻的隐特征输入物理量预测模块,得到每个隐特征对应的物理量预测值;
所述物理量预测模块的关系式为:
其中,x表示行,y表示列,X表示由x和y决定特征向量,t为时刻,q为阶数;
将每个隐特征与每个隐特征对应的物理量预测值相加,得到下一时刻对应图像的运动增强特征,进而得到第m+1张图像和第m+2张图像的运动增强特征,相加表达式如下:
ft+1=ht+Φ(ht);
其中,ft+1表示下一时刻对应图像的运动增强特征,ht表示隐特征,Φ(ht)表示隐特征对应的物理量预测值。
本申请的另一方面还提供了一种河流表面流速的估计装置,包括:
第一单元,用于获取双目相机对河流表面拍摄得到的多组图像,每组图像包括同一时间戳下拍摄得到的左目图和右目图;
第二单元,用于将各组图像依次输入至预先构建的细节增强模型,利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,进而得到多组分辨率达到设定阈值的图像,作为高清图像集合;
第三单元,用于将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速。
本申请的另一方面还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现所述的方法。
本申请的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现所述的方法。
本申请还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述的方法。
本申请具备以下有益效果:
1.本申请获取通过双目相机拍摄的图像,通过双目间视差匹配获得的信息,不需要现场预先标定即可获得世界坐标下的物理流速。
2.本申请通过细节增强模型将双目图像重建为高分辨率的高清图像,利用双目超分辨率重建的方法解决水面图像缺乏细节信息的问题,水面图像经过超分辨率重建以后,纹理特征细节更加清晰,使得最终计算结果更加准确。相较于现有的单目图像超分算法,本申请基于双目图像可以提供更多的真实图像信息,所以更加准确。
3.本申请采用双目图像可有效地去除前景干扰,增加了本申请的适用范围。另外,采用使用双目摄像装置拍摄图像,可避免现场标定过程,降低了现场工程人员的施工难度。
4.本申请采用基于深度学习的方法,对图像序列进行学习,同时融合了物理运动增强特征,对图像进行编解码处理,经过处理后的图像其变换的特征纹理更加清晰,方便后续估计得到河流表面的流速。
5.本申请基于深度学习的应用,可充分利用边缘网关的AI算力,解决传统应用大多依赖CPU资源,导致CPU资源紧张的问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种河流表面流速的估计方法的流程示意图;
图2为本申请实施例提供的一种双目摄像装置对河流表面拍摄图像的场景示意图;
图3为本申请实施例提供的一种细节增强模型的结构示意图;
图4为本申请实施例提供的一种立体交叉注意力模块的结构示意图;
图5为本申请实施例提供的一种流速估计模型的结构示意图;
图6为本申请实施例提供的一种VQ-VAE编解码器的结构示意图;
图7为本申请实施例提供的一种运动预测模块的结构示意图;
图8为本申请实施例提供的一种河流表面流速的估计装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。
说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
为了便于理解本申请实施例,对本申请实施例可能涉及到的关键词进行说明:
深度学习:源于人工神经网络的研究。通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
接下来,对本申请提供的一种河流表面流速的估计方法,参照图1,该方法包括步骤S100至步骤S120,具体如下:
S100:获取双目相机对河流表面拍摄得到的多组图像,每组图像包括同一时间戳下拍摄得到的左目图和右目图。
首先,对本实施例获取的图像进行说明,参照图2,本实施例提供了一种双目摄像装置(双目相机)对河流表面拍摄图像的场景示意图。
具体地,本实施例可以通过双目摄像装置以固定时间间隔t拍摄若干组图像(记录为原始图像集合S),每组图像可以是在同一时间戳下拍摄得到,分为左目图(L)和右目图(R)。
S110:将各组图像依次输入至预先构建的细节增强模型,利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,进而得到多组分辨率达到设定阈值的图像,作为高清图像集合。
具体地,将原始图像集合S中的一组图像为单位,输入预先构建的细节增强模型,生成分辨率达到设定阈值的高分辨率图像,同时也将各张高分辨率图像分为左目高清图(L′)和右目高清图(R′),得到高清图像集合(S′)。
进一步地,S110可以包括:
S1101:利用所述细节增强模型中的卷积层、NAFBlock层、SCAM层和Pixel Shuffle层生成分辨率达到设定阈值的图像,作为高清图像。
参照图3,本实施例提供了一种细节增强模型的结构示意图。
其中,所述NAFBlock层用于提取单个图像的特征。
具体地,NAFBlock层由层标准化模块,可分卷积模块,前馈神经网络模块组成,用于提取单个图像的特征。
所述SCAM层用于输出从左目图相对于右目图的第一特征映射并将所述第一特征映射与对应的右目图的特征进行融合;更进一步为:将左目图的特征对应的特征矩阵作为查询向量,将右目图的特征对应的特征矩阵作为键向量,将查询向量和键向量经层标准化和线性化,且对键向量进行转置后,对查询向量和键向量进行点积操作并堆叠,得到堆叠特征;将堆叠特征转置再经过softmax层与左目图线性化后的特征矩阵进行点积操作,得到的结果再与右目图的原始特征相加,以融合左目图和右目图的特征。
参照图4,本实施例提供了一种立体交叉注意力模块的结构示意图。其中,XL为左目图的特征矩阵,XR为右目图的特征矩阵,FL为融合后的左目图特征,FR为融合后的右目图特征。
具体地,SCAM层(立体交叉注意力模块),立体交叉注意力模块为双向注意力计算模块,可同时输出从左目相对于右目的特征映射和从右目相对于左目的特征映射。以从左目图到右目图的运算为例,由Query(查询向量),即左目图的特征矩阵,Key(键向量),即右目图的特征矩阵。两个特征矩阵经层标准化,线性化,转置(仅右目)后进行点击操作最后堆叠在一起。堆叠特征经转置后经过softmax层与左目线性化后的矩阵进行点积操作,其结果再与右目原始特征相加即完成了对双目特征的融合。
所述SCAM层也用于输出从右目图相对于左目图的第二特征映射并将所述第二特征映射与对应的左目图的特征进行融合;更进一步为:将右目图的特征对应的特征矩阵作为查询向量,将左目图的特征对应的特征矩阵作为键向量,将查询向量和键向量经层标准化和线性化,且对键向量进行转置后,对查询向量和键向量进行点积操作并堆叠,得到堆叠特征;将堆叠特征经转置再经过softmax层与右目图线性化后的特征矩阵。
具体地,从右目图到左目图的实施方式可以参照上述从左目图到右目图的运算例子,此处不赘述。
所述Pixel Shuffle层用于将经过所述SCAM层融合得到的特征并结合对应的左目图或右目图进行上采样,生成所述高清图像。
具体地,Pixel Shuffle层用于将之前融合特征结合原图进行上采用,完成图像的放大操作,形成高清图像。
因此,上述S1101可以更进一步包括:
将每组图像的左目图和右目图分别依次经过一个所述卷积层、一个所述NAFBlock层、多个所述SCAM层、一个所述NAFBlock层、一个所述SCAM层、一个所述卷积层以及一个所述Pixel Shuffle层进行处理,进而生成分辨率达到设定阈值的图像。
具体地,本实施例可以将左目图和右目图同时输入细节增强模型,使其分别经过卷积层和若干NAFBlock层和SCAM层,最后再通过Pixel Shuffle层生成高清图像。
S120:将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速。
参照图5,本实施例提供了一种流速估计模型的结构示意图。
流速计算中,采集连续帧数量,即高清图像集合的图像数为n,每次计算抽取其中m个连续帧作为图像序列进行运动预测,m>1且m<n。第一次计算采用1~m,第二次计算采用2~(m+1),以此类推,直至(n-m+1)~n。
进一步地,S120可以包括:
S1201:利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征,得到两组隐特征,每组隐特征包括m个隐特征;
具体地,高清图像集合(S′)中包括m张图像的图像序列经VQ-VAE编码器编码得到隐特征{h1,h2…hm}和{h2,h3…hm+1}。
S1202:将每组提取得到的m个隐特征分别输入运动预测模块,利用所述运动预测模块分别推演得到第m+1张图像的运动增强特征和第m+2张图像的运动增强特征;
具体地,将{h1,h2…hm}输入运动预测模块,通过该模块提取预测下一帧的物理运动增强特征fm+1;将{h2,h3…hm+1}输入运动预测模块,通过该模块提取预测下一帧的物理运动增强特征fm+2。
S1203:将每组提取得到的m个隐特征分别输入所述流速估计模型中的先验模型模块,利用所述先验模型模块分别推演得到第m+1张图像的图像增强特征gm+1和第m+2张图像的图像增强特征gm+2;
S1204:将第m+1张图像的运动增强特征与第m+1张图像的图像增强特征融合,得到第一融合特征hm+1 ′;将第m+2张图像的运动增强特征与第m+2张图像的图像增强特征融合,得到第二融合特征hm+2 ′;
具体地,将fm+1与gm+1融合得到融合后的特征hm+1 ′;将fm+2与gm+2融合得到融合后的特征hm+2 ′。
S1205:利用所述流速估计模型中的VQ-VAE解码器分别将所述第一融合特征和所述第二融合特征还原为第一目标图像和第二目标图像;
具体地,将hm+1 ′与hm+2 ′送入VQ-VAE解码器进行图像还原,经过图像还原之后,得到第一目标图像和第二目标图像,能够有效地消除干扰信息,突出两张目标图像发生变化的纹理信息。
S1206:对所述第一目标图像和所述第二目标图像进行关键点提取和匹配,得到若干个关键点及对应的相对像素位移;
具体地,对第一目标图像和第二目标图像分别进行关键点提取和匹配,得到若干关键点(u,v)和相对像素位移(u′,v′),其中u,v分别表示目标图像上横坐标和纵坐标。作为一种可选的实施方式,本实施例进行关键点提取时可采用SIFT或SURF等现有的算法,还可以采用其他可选的算法,本实施例不作严格限制。
S1207:根据双目测距公式和所述双目相机的设置参数将所述相对像素位移转换为实际的物理位移与河流表面的流速;
具体地,将像素位移转换为真实世界的物理位移(x,y)和流速(x/t,y/t)。可选地,本实施例可由双目测距公式和双目摄像装置的出厂参数求得物理位移与河流表面的流速。
S1208:将第3张至第m+3张图像作为新的前m张图像,将第4张至第m+4张图像作为新的第2张至第m+1张图像,执行所述利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征的步骤,直至所述高清图像集合中的所有图像被处理完成,得到多个河流表面的流速。
具体地,从高清图像集合中依次获取两组m张图像,重复执行S1201至S1208处理Sm+3至Sn-m+1,进而获得图像范围内不同像素位置的河流表面流速。
为了便于更清楚地了解S120,接下来对VQ-VAE编解码器进行详细说明。
参照图6,本实施例提供了一种VQ-VAE编解码器的结构示意图。
本实施例的编解码器使用了预训练的VQ-VAE,VQ-VAE是一种变分的自编码器,主要用来获取离散的隐特征,其架构如图6所示,其中左边为编码器,右边为解码器,编码表为编、解码器共享。
因此,所述利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征,得到两组隐特征,每组隐特征包括m个隐特征这一步骤可以包括:利用所述VQ-VAE编码器对包括m张图像的每组图像序列在时空维度使用3D卷积下采样,得到对应的图像特征;利用所述VQ-VAE编码器中的残差注意力模块压缩所述图像特征。
具体地,本实施例可以使用包括m张图像的图像序列作为的VQ-VAE编码器输入,在时空维度使用3D卷积下采样,然后使用了残差注意力模块,压缩高维的图像特征。
本实施例还可以包括:利用所述VQ-VAE编码器中的编码表获得离散化的隐特征;利用所述离散化的隐特征训练所述先验模型模块,以根据训练后的先验模型模块获得所述图像增强特征;
具体地,在上述使用残差注意力模块压缩高维的图像特征后,本实施例再通过与编码表中的特征向量采用最短距离法获得最相近特征向量的索引,从而获得离散隐特征向量,即隐特征。
进而,所述利用所述流速估计模型中的VQ-VAE解码器分别将所述第一融合特征和所述第二融合特征还原为第一目标图像和第二目标图像这一步骤,可以包括:
将离散化的第一融合特征和第二融合特征通过编码表映射回原始图像特征,经过残差注意力模块进行处理,再经过3D转置卷积进行上采样,以还原得到第一目标图像和第二目标图像。
具体地,本实施例将第一融合特征和第二融合特征还原为对应的图像,分别作为第一目标图像和第二目标图像。
接下来,对上述S1202,将每组提取得到的m个隐特征分别输入运动预测模块,利用所述运动预测模块分别推演得到第m+1张图像的运动增强特征和第m+2张图像的运动增强特征这一步骤进行说明
首先,对本实施例的运动预测模块进行说明,参照图7,本实施例提供了一种运动预测模块的结构示意图,运动预测模块的作用是通过深度学习的方法从输入的特征向量中预测下一时刻的特征。
具体地,S1202可以包括:
每个时刻的隐特征输入运动预测模块中的物理量预测模块Φ(ht),得到每个隐特征对应的物理量预测值;
所述物理量预测模块的关系式为:
其中,x表示行,y表示列,X表示由x和y决定特征向量,t为时刻,q为阶数;本实施例采用卷积神经网络近似求解偏导数的方法,该卷积神经网络由一系列卷积层组成。而t时刻的物理量预测值=t时刻每个位置(x,y)隐特征的偏导之和。
将每个隐特征与每个隐特征对应的物理量预测值相加,得到下一时刻对应图像的运动增强特征,进而得到第m+1张图像和第m+2张图像的运动增强特征,相加表达式如下:
ft+1=ht+Φ(ht);
其中,ft+1表示下一时刻对应图像的运动增强特征,ht表示隐特征,Φ(ht)表示隐特征对应的物理量预测值。
具体地,t+1时刻的运动增强特征等于t时的隐特征与t时刻的物理量预测值相加。
需要说明的是,一个时刻的隐特征对应一张图像,包括m张图像的图像序列对应m个时刻及m个时刻的隐特征。
本申请通过双目相机拍摄得到的图像并结合深度学习的方法对水面的特征纹理进行加强,产生高分图像,优化了水面特征纹理细节,同时还引入了物理运动模型(即运动预测模块)对图像特征进行增强,突出水流的运动纹理特征,从而改善了关键点提取质量,提高了匹配的准确度,使得最终流速计算的结果更加准确。
参照图8,本申请实施例提供了一种河流表面流速的估计装置,包括:
第一单元,用于获取双目相机对河流表面拍摄得到的多组图像,每组图像包括同一时间戳下拍摄得到的左目图和右目图;
第二单元,用于将各组图像依次输入至预先构建的细节增强模型,利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,进而得到多组分辨率达到设定阈值的图像,作为高清图像集合;
第三单元,用于将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速。
该估计装置的具体实施方式与上述估计方法的具体实施例基本相同,在此不再赘述。
本申请实施例还提供了一种电子设备,电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述估计方法。
具体地,电子设备可以是用户终端,也可以是服务器。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述估计方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行图1所示的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本申请的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本申请,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本申请是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本申请。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本申请的范围,本申请的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)、便携式计算机盘盒(磁装置)、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编辑只读存储器(EPROM或闪速存储器)、光纤装置以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施例,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同物限定。
以上是对本申请的较佳实施进行了具体说明,但本申请并不限于所述实施例,熟悉本领域的技术人员在不违背本申请精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (9)
1.一种河流表面流速的估计方法,其特征在于,包括:
获取双目相机对河流表面拍摄得到的多组图像,每组图像包括同一时间戳下拍摄得到的左目图和右目图;
将各组图像依次输入至预先构建的细节增强模型,利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,进而得到多组分辨率达到设定阈值的图像,作为高清图像集合;
将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速;
所述将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速,包括:
利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征,得到两组隐特征,每组隐特征包括m个隐特征;
将每组提取得到的m个隐特征分别输入运动预测模块,利用所述运动预测模块分别推演得到第m+1张图像的运动增强特征和第m+2张图像的运动增强特征;
将每组提取得到的m个隐特征分别输入所述流速估计模型中的先验模型模块,利用所述先验模型模块分别推演得到第m+1张图像的图像增强特征和第m+2张图像的图像增强特征;
将第m+1张图像的运动增强特征与第m+1张图像的图像增强特征融合,得到第一融合特征;将第m+2张图像的运动增强特征与第m+2张图像的图像增强特征融合,得到第二融合特征;
利用所述流速估计模型中的VQ-VAE解码器分别将所述第一融合特征和所述第二融合特征还原为第一目标图像和第二目标图像;
对所述第一目标图像和所述第二目标图像进行关键点提取和匹配,得到若干个关键点及对应的相对像素位移;
根据双目测距公式和所述双目相机的设置参数将所述相对像素位移转换为实际的物理位移与河流表面的流速;
将第3张至第m+3张图像作为新的前m张图像,将第4张至第m+4张图像作为新的第2张至第m+1张图像,执行所述利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征的步骤,直至所述高清图像集合中的所有图像被处理完成,得到多个河流表面的流速。
2.根据权利要求1所述的一种河流表面流速的估计方法,其特征在于,所述利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,包括:
利用所述细节增强模型中的卷积层、NAFBlock层、SCAM层和Pixel Shuffle层生成分辨率达到设定阈值的图像,作为高清图像;
其中,所述NAFBlock层用于提取单个图像的特征;
所述SCAM层用于输出从左目图相对于右目图的第一特征映射并将所述第一特征映射与对应的右目图的特征进行融合,也用于输出从右目图相对于左目图的第二特征映射并将所述第二特征映射与对应的左目图的特征进行融合;
所述Pixel Shuffle层用于将经过所述SCAM层融合得到的特征并结合对应的左目图或右目图进行上采样,生成所述高清图像。
3.根据权利要求2所述的一种河流表面流速的估计方法,其特征在于,所述利用所述细节增强模型中的卷积层、NAFBlock层、SCAM层和Pixel Shuffle层生成分辨率达到设定阈值的图像,包括:
将每组图像的左目图和右目图分别依次经过一个所述卷积层、一个所述NAFBlock层、多个所述SCAM层、一个所述NAFBlock层、一个所述SCAM层、一个所述卷积层以及一个所述Pixel Shuffle层进行处理,进而生成分辨率达到设定阈值的图像。
4.根据权利要求2或3所述的一种河流表面流速的估计方法,其特征在于,所述输出从左目图相对于右目图的第一特征映射并将所述第一特征映射与对应的右目图的特征进行融合,包括:
将左目图的特征对应的特征矩阵作为查询向量,将右目图的特征对应的特征矩阵作为键向量,将查询向量和键向量经层标准化和线性化,且对键向量进行转置后,对查询向量和键向量进行点积操作并堆叠,得到堆叠特征;将堆叠特征转置再经过softmax层与左目图线性化后的特征矩阵进行点积操作,得到的结果再与右目图的原始特征相加,以融合左目图和右目图的特征;
所述输出从右目图相对于左目图的第二特征映射并将所述第二特征映射与对应的左目图的特征进行融合,包括:
将右目图的特征对应的特征矩阵作为查询向量,将左目图的特征对应的特征矩阵作为键向量,将查询向量和键向量经层标准化和线性化,且对键向量进行转置后,对查询向量和键向量进行点积操作并堆叠,得到堆叠特征;将堆叠特征经转置再经过softmax层与右目图线性化后的特征矩阵进行点积操作,得到的结果再与左目图的原始特征相加,以融合左目图和右目图的特征。
5.根据权利要求1所述的一种河流表面流速的估计方法,其特征在于,所述利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征,得到两组隐特征,每组隐特征包括m个隐特征,包括:
利用所述VQ-VAE编码器对包括m张图像的每组图像序列在时空维度使用3D卷积下采样,得到对应的图像特征;
利用所述VQ-VAE编码器中的残差注意力模块压缩所述图像特征;
所述方法还包括:
利用所述VQ-VAE编码器中的编码表获得离散化的隐特征;
利用所述离散化的隐特征训练所述先验模型模块,以根据训练后的先验模型模块获得所述图像增强特征;
所述利用所述流速估计模型中的VQ-VAE解码器分别将所述第一融合特征和所述第二融合特征还原为第一目标图像和第二目标图像,包括:
将离散化的第一融合特征和第二融合特征经过残差注意力模块进行处理,再经过3D转置卷积进行上采样,以还原得到第一目标图像和第二目标图像。
6.根据权利要求1所述的一种河流表面流速的估计方法,其特征在于,所述将每组提取得到的m个隐特征分别输入运动预测模块,利用所述运动预测模块分别推演得到第m+1张图像的运动增强特征和第m+2张图像的运动增强特征,包括:
每个时刻的隐特征输入物理量预测模块,得到每个隐特征对应的物理量预测值;
所述物理量预测模块的关系式为:
其中,x表示行,y表示列,X表示由x和y决定特征向量,t为时刻,q为阶数,i为关于x的阶数,j为关于y的阶数,h为隐特征函数;
将每个隐特征与每个隐特征对应的物理量预测值相加,得到下一时刻对应图像的运动增强特征,进而得到第m+1张图像和第m+2张图像的运动增强特征,相加表达式如下:
ft+1=ht+Φ(ht);
其中,ft+1表示下一时刻对应图像的运动增强特征,ht表示隐特征,Φ(ht)表示隐特征对应的物理量预测值。
7.一种河流表面流速的估计装置,其特征在于,包括:
第一单元,用于获取双目相机对河流表面拍摄得到的多组图像,每组图像包括同一时间戳下拍摄得到的左目图和右目图;
第二单元,用于将各组图像依次输入至预先构建的细节增强模型,利用所述细节增强模型提取每组图像的特征,根据每组图像的特征生成一组分辨率达到设定阈值的图像,进而得到多组分辨率达到设定阈值的图像,作为高清图像集合;
第三单元,用于将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速;
所述将所述高清图像集合输入至预先构建的流速估计模型,利用所述流速估计模型提取所述高清图像集合的隐特征,根据所述隐特征生成运动增强图像,再根据所述运动增强图像估计得到河流表面的流速,包括:
利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征,得到两组隐特征,每组隐特征包括m个隐特征;
将每组提取得到的m个隐特征分别输入运动预测模块,利用所述运动预测模块分别推演得到第m+1张图像的运动增强特征和第m+2张图像的运动增强特征;
将每组提取得到的m个隐特征分别输入所述流速估计模型中的先验模型模块,利用所述先验模型模块分别推演得到第m+1张图像的图像增强特征和第m+2张图像的图像增强特征;
将第m+1张图像的运动增强特征与第m+1张图像的图像增强特征融合,得到第一融合特征;将第m+2张图像的运动增强特征与第m+2张图像的图像增强特征融合,得到第二融合特征;
利用所述流速估计模型中的VQ-VAE解码器分别将所述第一融合特征和所述第二融合特征还原为第一目标图像和第二目标图像;
对所述第一目标图像和所述第二目标图像进行关键点提取和匹配,得到若干个关键点及对应的相对像素位移;
根据双目测距公式和所述双目相机的设置参数将所述相对像素位移转换为实际的物理位移与河流表面的流速;
将第3张至第m+3张图像作为新的前m张图像,将第4张至第m+4张图像作为新的第2张至第m+1张图像,执行所述利用所述流速估计模型中的VQ-VAE编码器分别提取所述高清图像集合中前m张图像和第2张至第m+1张图像的隐特征的步骤,直至所述高清图像集合中的所有图像被处理完成,得到多个河流表面的流速。
8.一种电子设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至6中任一项所述的一种河流表面流速的估计方法。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至6中任一项所述的一种河流表面流速的估计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311440505.5A CN117274316B (zh) | 2023-10-31 | 2023-10-31 | 一种河流表面流速的估计方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311440505.5A CN117274316B (zh) | 2023-10-31 | 2023-10-31 | 一种河流表面流速的估计方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117274316A CN117274316A (zh) | 2023-12-22 |
CN117274316B true CN117274316B (zh) | 2024-05-03 |
Family
ID=89212576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311440505.5A Active CN117274316B (zh) | 2023-10-31 | 2023-10-31 | 一种河流表面流速的估计方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117274316B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110807742A (zh) * | 2019-11-21 | 2020-02-18 | 西安工业大学 | 一种基于一体式网络的微光图像增强方法 |
WO2020232909A1 (zh) * | 2019-05-20 | 2020-11-26 | 平安科技(深圳)有限公司 | 行人视觉跟踪方法、模型训练方法、装置、设备及存储介质 |
CN112991419A (zh) * | 2021-03-09 | 2021-06-18 | Oppo广东移动通信有限公司 | 视差数据生成方法、装置、计算机设备及存储介质 |
CN113781528A (zh) * | 2021-08-26 | 2021-12-10 | 山东新一代信息产业技术研究院有限公司 | 一种基于光流计算的河流表面流速测算方法 |
CN114612289A (zh) * | 2022-03-03 | 2022-06-10 | 广州虎牙科技有限公司 | 风格化图像生成方法、装置及图像处理设备 |
WO2022242029A1 (zh) * | 2021-05-18 | 2022-11-24 | 广东奥普特科技股份有限公司 | 视觉分辨率增强的生成方法、系统、装置及存储介质 |
CN115409738A (zh) * | 2022-09-26 | 2022-11-29 | 广东省水利水电科学研究院 | 一种巡河视频图像去雾方法、系统、装置及存储介质 |
CN115439367A (zh) * | 2022-09-21 | 2022-12-06 | 鼎富智能科技有限公司 | 一种图像增强方法、装置、电子设备及存储介质 |
CN115482353A (zh) * | 2022-09-01 | 2022-12-16 | 北京百度网讯科技有限公司 | 重建网络的训练方法、重建方法、装置、设备和介质 |
WO2023098524A1 (zh) * | 2021-12-02 | 2023-06-08 | 天津御锦人工智能医疗科技有限公司 | 多模态医学数据融合的评估方法、装置、设备及存储介质 |
CN116450788A (zh) * | 2023-03-24 | 2023-07-18 | 华南理工大学 | 一种医学视觉问答的实现方法、装置及存储介质 |
WO2023168903A1 (zh) * | 2022-03-10 | 2023-09-14 | 腾讯科技(深圳)有限公司 | 模型训练和身份匿名化方法、装置、设备、存储介质及程序产品 |
CN116797461A (zh) * | 2023-07-12 | 2023-09-22 | 福州大学 | 基于多级强化注意力机制的双目图像超分辨率重建方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230120638A1 (en) * | 2021-04-26 | 2023-04-20 | Springloc Ltd | Augmented reality soft tissue biopsy and surgery system |
-
2023
- 2023-10-31 CN CN202311440505.5A patent/CN117274316B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020232909A1 (zh) * | 2019-05-20 | 2020-11-26 | 平安科技(深圳)有限公司 | 行人视觉跟踪方法、模型训练方法、装置、设备及存储介质 |
CN110807742A (zh) * | 2019-11-21 | 2020-02-18 | 西安工业大学 | 一种基于一体式网络的微光图像增强方法 |
CN112991419A (zh) * | 2021-03-09 | 2021-06-18 | Oppo广东移动通信有限公司 | 视差数据生成方法、装置、计算机设备及存储介质 |
WO2022242029A1 (zh) * | 2021-05-18 | 2022-11-24 | 广东奥普特科技股份有限公司 | 视觉分辨率增强的生成方法、系统、装置及存储介质 |
CN113781528A (zh) * | 2021-08-26 | 2021-12-10 | 山东新一代信息产业技术研究院有限公司 | 一种基于光流计算的河流表面流速测算方法 |
WO2023098524A1 (zh) * | 2021-12-02 | 2023-06-08 | 天津御锦人工智能医疗科技有限公司 | 多模态医学数据融合的评估方法、装置、设备及存储介质 |
CN114612289A (zh) * | 2022-03-03 | 2022-06-10 | 广州虎牙科技有限公司 | 风格化图像生成方法、装置及图像处理设备 |
WO2023168903A1 (zh) * | 2022-03-10 | 2023-09-14 | 腾讯科技(深圳)有限公司 | 模型训练和身份匿名化方法、装置、设备、存储介质及程序产品 |
CN115482353A (zh) * | 2022-09-01 | 2022-12-16 | 北京百度网讯科技有限公司 | 重建网络的训练方法、重建方法、装置、设备和介质 |
CN115439367A (zh) * | 2022-09-21 | 2022-12-06 | 鼎富智能科技有限公司 | 一种图像增强方法、装置、电子设备及存储介质 |
CN115409738A (zh) * | 2022-09-26 | 2022-11-29 | 广东省水利水电科学研究院 | 一种巡河视频图像去雾方法、系统、装置及存储介质 |
CN116450788A (zh) * | 2023-03-24 | 2023-07-18 | 华南理工大学 | 一种医学视觉问答的实现方法、装置及存储介质 |
CN116797461A (zh) * | 2023-07-12 | 2023-09-22 | 福州大学 | 基于多级强化注意力机制的双目图像超分辨率重建方法 |
Non-Patent Citations (4)
Title |
---|
基于双目视觉的增强现实模型系统设计;陈春妃;陈琼;汤勇明;;电子器件;20160420(02);18-22 * |
基于机器视觉的河水表面流速估计;冯全;张彦洪;赵晓刚;;农业工程学报;20181008(19);148-154 * |
基于深度迁移学习的烟雾识别方法;王文朋;毛文涛;何建樑;窦智;计算机应用;20171110(11);144-149+161 * |
基于神经网络结构搜索的图像超分辨研究;管旭辰;《东南大学》;20210609;4-10 * |
Also Published As
Publication number | Publication date |
---|---|
CN117274316A (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111047548B (zh) | 姿态变换数据处理方法、装置、计算机设备和存储介质 | |
CN109166144B (zh) | 一种基于生成对抗网络的图像深度估计方法 | |
Lu et al. | Depth map reconstruction for underwater Kinect camera using inpainting and local image mode filtering | |
Alvarez et al. | Application of deep learning image-to-image transformation networks to GPR radargrams for sub-surface imaging in infrastructure monitoring | |
CN111160210B (zh) | 一种基于视频的水流速检测方法及系统 | |
CN105488759B (zh) | 一种基于局部回归模型的图像超分辨率重建方法 | |
CN112562001B (zh) | 一种物体6d位姿估计方法、装置、设备及介质 | |
CN113343822B (zh) | 一种基于3d卷积的光场显著性目标检测方法 | |
CN114972332B (zh) | 一种基于图像超分辨率重建网络的竹集成材裂纹检测方法 | |
Varshney et al. | Deep ice layer tracking and thickness estimation using fully convolutional networks | |
Sung et al. | Realistic sonar image simulation using generative adversarial network | |
Zhang et al. | Dense haze removal based on dynamic collaborative inference learning for remote sensing images | |
CN113281779B (zh) | 一种3d物体快速检测方法、装置、设备及介质 | |
Xie et al. | Inferring depth contours from sidescan sonar using convolutional neural nets | |
CN114396877A (zh) | 面向材料力学性能的智能三维位移场及应变场测量方法 | |
CN117274316B (zh) | 一种河流表面流速的估计方法、装置、设备及存储介质 | |
CN117745944A (zh) | 预训练模型确定方法、装置、设备以及存储介质 | |
Wewer et al. | latentsplat: Autoencoding variational gaussians for fast generalizable 3d reconstruction | |
Kim et al. | Enhanced Object Detection in Bird's Eye View Using 3D Global Context Inferred From Lidar Point Data | |
US20230177771A1 (en) | Method for performing volumetric reconstruction | |
Baby et al. | Face depth estimation and 3D reconstruction | |
Jee et al. | Hologram super-resolution using dual-generator gan | |
Ziaei et al. | Convolutional lstm for planetary boundary layer height (pblh) prediction | |
Kingkan et al. | Generating mesh-based shapes from learned latent spaces of point clouds with VAE-GAN | |
Le Coz et al. | Video-based hydrometry: a Bayesian camera calibration method for uncertainty analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |