CN113240733A - 一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质 - Google Patents
一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN113240733A CN113240733A CN202110363100.0A CN202110363100A CN113240733A CN 113240733 A CN113240733 A CN 113240733A CN 202110363100 A CN202110363100 A CN 202110363100A CN 113240733 A CN113240733 A CN 113240733A
- Authority
- CN
- China
- Prior art keywords
- bucket
- excavator
- real
- time image
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 230000003190 augmentative effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 239000002689 soil Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10012—Stereo images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
Abstract
本发明能够提供一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质,该方法包括:获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像,对实时图像进行目标识别处理,以提取出挖掘机的挖斗位置信息。根据挖斗位置信息确定挖斗深度信息。从实时图像中查找到与挖斗深度信息匹配的像素区域。在该视频中的实时图像上标记出像素区域,以形成挖斗在实时图像中地面上的投影。本发明能够通过在拍摄的实时图像上进行标记的方式为驾驶员提供参照物,从而辅助挖掘机驾驶员更准确地判断出地面的远近高低距离,降低挖掘机驾驶操作难度,降低了对驾驶员操作经验和工作状态的依赖,从根本上解决由于无法分清地面远近距离导致的驾驶员误操作等问题的发生。
Description
技术领域
本发明涉及挖掘机驾驶技术领域,更为具体来说,本发明能够提供一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质。
背景技术
在挖掘机驾驶领域,一般要求驾驶员具备挖掘、装载、平整、破碎等挖掘机操作技能。挖掘机的工作环境往往都比较恶劣,例如土石方、石场、沙场、隧道、拆迁等等。可见驾驶员经常会遇到地面颜色相近而难以分清地面远近距离的情况,在这种情况下容易发生误操作、伤人或损伤挖掘机等问题;特别在远程驾驶挖掘机的场景下,上述问题发生的概率会更高。另外,在强光照下作业也经常会出现难以分清地面远近距离的情况。目前解决上述问题的方式主要依赖驾驶经验和运气,对驾驶员操作经验、技能以及当前工作状态依赖过大,但是仍然无法从根本上解决问题。
发明内容
为解决在驾驶挖掘机时难以分清地面远近距离的问题,本发明提供了一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质,能够达到辅助驾驶员判断出地面远近距离等至少一个技术目的。
为实现上述的技术目的,本发明能够提供一种用于辅助驾驶挖掘机的方法,该方法可包括但不限于如下的一个或多个步骤。
获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像。
对所述实时图像进行目标识别处理,以从所述实时图像中提取出所述挖掘机的挖斗位置信息。所述目标为所述挖掘机的挖斗。
根据所述挖斗位置信息确定挖斗深度信息。
从所述实时图像中查找到与所述挖斗深度信息匹配的像素区域。
在所述视频中的实时图像上标记出所述像素区域,以形成所述挖斗在所述实时图像中地面上的投影。
进一步地,所述从所述实时图像中查找到与所述挖斗深度信息匹配的像素区域包括:
在所述实时图像上划分出选定区域。
计算所述选定区域内的各像素点与所述挖斗中心的像素点的深度差。
根据所述深度差形成所述像素区域。
进一步地,所述在所述实时图像上划分出选定区域包括:
基于所述挖斗位置信息在所述实时图像中挖斗的下方形成多个具有预设形状的选取框。
将所述选取框作为所述选定区域。
进一步地,所述基于所述挖斗位置信息在所述实时图像中挖斗的下方形成多个具有预设形状的选取框包括:
根据所述挖斗位置信息设置具有预设形状的滑动窗口,所述滑动窗口处于所述实时图像中挖斗的正下方。
控制所述滑动窗口按照设定位移竖直向下移动,将所述滑动窗口每次停留所覆盖的区域作为一个所述选取框。
进一步地,所述根据所述挖斗位置信息确定挖斗深度信息包括:
根据所述挖斗位置信息计算挖斗在双目摄像头上的视差。
其中,所述双目摄像头包括第二摄像头和第三摄像头,所述第二摄像头与所述第三摄像头具有相同的焦距。
通过所述视差、所述焦距以及所述第二摄像头与所述第三摄像头之间的基线距离确定所述挖斗深度信息。
进一步地,所述对所述实时图像进行目标识别处理包括:
利用训练完成的识别模型对所述实时图像中的挖斗进行识别;其中,通过已标注挖斗的多张图片训练卷积神经网络模型的方式得到所述识别模型。
进一步地,所述在所述视频中的实时图像上标记出所述像素区域包括:
通过增强现实方式对所述视频中的实时图像上的像素区域进行标记。
为实现上述的技术目的,本发明还能够提供一种用于辅助驾驶挖掘机的系统,该系统可包括但不限于实时图像获取模块、挖斗位置识别模块、挖斗深度计算模块、像素区域匹配模块以及地面投影标记模块。
实时图像获取模块,用于获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像。
挖斗位置识别模块,用于对所述实时图像进行目标识别处理,以从所述实时图像中提取出所述挖掘机的挖斗位置信息。所述目标为所述挖掘机的挖斗。
挖斗深度计算模块,用于根据所述挖斗位置信息确定挖斗深度信息。
像素区域匹配模块,用于从所述实时图像中查找到与所述挖斗深度信息匹配的像素区域。
地面投影标记模块,用于在所述视频中的实时图像上标记出所述像素区域,以形成所述挖斗在所述实时图像中地面上的投影。
为实现上述技术目的,本发明还可提供一种计算机设备,计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行本发明任一实施例中所述用于辅助驾驶挖掘机的方法的步骤。
为实现上述技术目的,本发明还能够提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行本发明任一实施例中所述用于辅助驾驶挖掘机的方法的步骤。
本发明的有益效果为:
本发明能够通过在拍摄的实时图像上进行标记的方式为驾驶员提供在实时图像中地面上的参照物,以辅助挖掘机驾驶员更准确地判断出地面的远近高低距离,降低挖掘机驾驶的操作难度,并降低对驾驶员操作经验以及工作状态的依赖,从根本上解决了由于无法分清地面远近距离而可能导致的误操作等问题的发生。
本发明能够在实时图像中的地面上形成挖斗的投影,从而满足挖掘机驾驶员通过挖斗投影更好地判断距离,以达到安全作业、精准作业及科学作业等多个技术目的,驾驶员使用体验较佳,极大提升了驾驶员的满意度。
本发明所确定的投影位置是基于像素级的深度匹配而得到的,可见本发明还具有准确性较高、数据处理精度高以及可信赖度较强等突出优点,且对远程操作挖掘机等依赖画面进行大型机械设备控制的场景更为适用。
附图说明
图1示出了本发明一个或多个实施例中用于辅助驾驶挖掘机的方法的流程示意图。
图2示出了本发明一个或多个实施例中基于设置的滑动窗口确定与挖斗深度信息匹配的像素区域的示意图。
图3示出了在图2的基础上形成挖斗在实时图像中地面上的投影的示意图。
图4示出了本发明另一些实施例中形成挖斗在实时图像中地面上的投影的示意图。
图5示出了本发明一个或多个实施例中用于辅助驾驶挖掘机的系统的结构组成示意图。
具体实施方式
下面结合说明书附图对本发明所提供的一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质进行详细的解释和说明。
如图1所示,并可结合图2至5,本发明一个或多个实施例能够提供一种用于辅助驾驶挖掘机的方法。本发明所提供的用于辅助驾驶挖掘机的方法能够用在远程遥控驾驶挖掘机场景,或者用在现场驾驶挖掘机场景;本发明技术方案能够为挖掘机驾驶员提供挖掘机挖斗的投影,从而更好地判断距离和进行作业;该方法可包括但不限于如下的一个或多个步骤。
首先,利用挖掘机上的摄像头得到具有挖斗的视频流,具体获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像。
其次,对实时图像进行目标识别处理,以从实时图像中提取出挖掘机的挖斗位置信息。可见本发明涉及的目标为挖掘机的挖斗,需要从当前的实时图像中识别出挖斗及其位置信息,并可在图示中用虚线方框标出。
具体地,本发明一个或多个实施例对当前实时图像进行目标识别处理可包括:利用已经训练完成的识别模型对该实时图像中的挖斗进行识别。其中,通过已标注挖斗的多张图片训练卷积神经网络模型的方式得到识别模型。更为具体地,本发明可事先通过相机获取大量的包含挖掘机挖斗的图片并进行标注,以制作用于模型训练的数据集;然后以标注完成的图片作为模型输入,通过卷积神经网络模型提取图片特征,计算出成本函数。本发明一些实施例可以利用梯度下降法等方式反复地迭代卷积神经网络模型,更新卷积神经网络模型权重,以达到减小成本函数的目的;并最终得到经过反复迭代后形成的卷积神经网络模型,即本发明所需使用的识别模型。因此,本发明能够通过深度学习方式训练得到卷积神经网络模型,以达到识别出通过摄像头采集的图像中的挖斗及其位置的目的。
再次,本发明能根据挖斗位置信息计算挖斗在双目摄像头上的视差。本发明所使用的双目摄像头可部署于挖掘机上合适的位置,例如,挖掘机驾驶舱或者挖掘机机臂上等。双目摄像头至少能够包括第二摄像头和第三摄像头,第二摄像头与第三摄像头具有相同的焦距,通过视差、焦距以及第二摄像头与第三摄像头之间的基线距离确定挖斗深度信息。可见本发明能够根据挖斗位置信息和通过双目摄像头获取的信息进行立体匹配,确定挖斗深度信息。
本发明能够通过如下方式计算挖斗深度信息,具体计算的可以是挖斗中心像素点的深度信息。
Z=(f×Tx)/(xl﹣xr)
其中,Z表示本发明待计算的挖斗中心像素点的深度值,f表示双目摄像头的焦距,Tx表示第二摄像头与第三摄像头之间的基线距离,xl﹣xr表示双目摄像头的视差,xl表示本发明挖斗中心像素点在第二摄像头中的成像对应的x坐标,xr表示本发明挖斗中心像素点在第三摄像头中的成像对应的x坐标。
可理解的是,本发明一些实施例中具体使用的第一摄像头可以是单独安装于挖掘机上的摄像头,或者也可以为本发明涉及的第二摄像头、第三摄像头中的一个。
如图2所示,根据挖斗位置信息设置具有预设形状的滑动窗口,滑动窗口处于实时图像中挖斗的正下方。图示中提供了五个滑动窗口状态示意图,窗口预设形状如图示的矩形,当然也可以为圆形、三角形、菱形等。图2中的虚线能够用于表示自上而下滑动后的滑动窗口的停留位置,地面上的线条能够用于表示土坑、土包、沙土等挖掘机在具体工作环境中经常遇到的地面情况。
本发明一些实施例中的初始的滑动窗口能够贴靠实时图像中的挖斗设置,然后以挖斗所在位置为起点,控制滑动窗口按照设定位移竖直向下移动。本发明能够将滑动窗口每次停留所覆盖的区域作为一个选取框,以实现基于挖斗位置信息在实时图像中挖斗的下方形成多个具有预设形状的区域的选取框。本发明能够将选取框作为选定区域,以实现在实时图像上划分出选定区域。
进一步来说,本发明实施时计算选定区域内的各像素点与挖斗中心的像素点的深度差,即依次地计算滑动窗口区域内各个像素点的深度是否与挖斗深度匹配,具体根据该深度差形成像素区域,所以本发明能够实现从实时图像中查找到与挖斗深度信息匹配的像素区域。可见本发明能够通过滑动窗口法准确地识别出与挖斗深度匹配的像素区域,如图2所示,在1、2、3、4、5号窗口中,5号窗口对应区域所得的深度与挖斗最为匹配。
本发明一些实施例中设置的匹配条件包括但不限于:滑动窗口区域内像素点的深度值与挖斗中心像素点的深度值的偏差小于或等于预设值;该预设值例如可以为5%。以实现根据深度差形成像素区域,下面举例说明。
例如,挖斗中心像素点的深度值为6.14米,滑动窗口区域内某个像素点的深度值为5.92米,则|6.14﹣5.92|÷6.14≈3.58%<5%,则说明该滑动窗口区域内的该像素点符合本发明的匹配条件。
如图3、4所示,本发明能够识别出与挖斗深度信息匹配的像素区域为挖斗在竖直方向上的投影。所以最后本发明在视频中的实时图像上标记出像素区域,以形成挖掘机挖斗在实时图像中地面上的投影,投影为图示中的椭圆的图形示意。在实时图像中地面上的投影可直接呈现给挖掘机的驾驶员作为参照物,可见本发明具有直观性非常好、使用体验极佳等突出优点。
本发明一些实施例中在视频中的实时图像上标记出像素区域可包括:通过增强现实(AR,全称Augmented Reality)方式对视频中的实时图像上的像素区域进行标记,以将虚拟投影和现实画面结合起来。该实现方式对于远程驾驶场景更适用,通过在摄像头画面中形成投影的方式使驾驶员看到的摄像头传回的实时图像中的地面上有影子作为标志物,从而较好地辅助驾驶员判断距离深度,提高操作的准确性。
如图5所示,与本发明提供的方法基于相同的技术构思,本发明还有一个或多个实施例能够提供一种用于辅助驾驶挖掘机的系统。具体地,该系统包括但不限于实时图像获取模块、挖斗位置识别模块、挖斗深度计算模块、像素区域匹配模块以及地面投影标记模块等;对于组成本发明系统的常规组成部分,例如画面显示装置、数据传输装置、供电装置等等,本发明不再进行赘述。
实时图像获取模块用于获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像。
挖斗位置识别模块用于对实时图像进行目标识别处理以从实时图像中提取出挖掘机的挖斗位置信息,该目标为挖掘机的挖斗。挖斗位置识别模块用于利用训练完成的识别模型对实时图像中的挖斗进行识别;其中,基于深度学习通过已标注挖斗的多张图片训练卷积神经网络模型的方式得到识别模型。
挖斗深度计算模块用于根据挖斗位置信息确定挖斗深度信息。该挖斗深度计算模块可具体用于根据挖斗位置信息计算挖斗在双目摄像头上的视差,并用于通过视差、焦距以及第二摄像头与第三摄像头之间的基线距离确定挖斗深度信息。其中,双目摄像头包括第二摄像头和第三摄像头,第二摄像头与第三摄像头具有相同的焦距。
像素区域匹配模块可用于从实时图像中查找到与挖斗深度信息匹配的像素区域。像素区域匹配模块具体用于在实时图像上划分出选定区域,并用于计算选定区域内的各像素点与挖斗中心的像素点的深度差,以及用于根据所述深度差形成像素区域。本实施例中像素区域匹配模块用于基于挖斗位置信息在实时图像中挖斗的下方形成多个具有预设形状的选取框,并将选取框作为选定区域。更为具体地,该像素区域匹配模块用于根据挖斗位置信息设置具有预设形状的滑动窗口,滑动窗口处于实时图像中挖斗的正下方;像素区域匹配模块用于控制滑动窗口按照设定位移竖直向下移动,将滑动窗口每次停留所覆盖的区域作为一个选取框。
地面投影标记模块用于在视频中的实时图像上标记出像素区域,以形成挖斗在实时图像中地面上的投影。本发明实施例地面投影标记模块具体可用于通过增强现实方式对视频中的实时图像上的像素区域进行标记。
本发明能够通过在拍摄的实时图像上进行标记的方式为驾驶员提供挖斗的投影参照物,以辅助挖掘机驾驶员更准确地判断出地面的远近高低距离,降低驾驶员的挖掘机操作难度,降低对驾驶员操作经验、能力以及工作状态的依赖,所以本发明能够从根本上解决了由于无法分清地面远近距离导致的误操作等问题的发生。
本发明还有一些实施例能够提供一种计算机设备,该计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行本发明任一实施例中用于辅助驾驶挖掘机的方法的步骤。其中用于辅助驾驶挖掘机的方法包括:首先,获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像。其次,对实时图像进行目标识别处理,以从实时图像中提取出挖掘机的挖斗位置信息。目标为挖掘机的挖斗。本发明一些实施例对实时图像进行目标识别处理包括:利用训练完成的识别模型对实时图像中的挖斗进行识别;其中,通过已标注挖斗的多张图片训练卷积神经网络模型的方式得到识别模型。再次,根据挖斗位置信息计算挖斗在双目摄像头上的视差;其中,双目摄像头包括第二摄像头和第三摄像头,第二摄像头与第三摄像头具有相同的焦距;通过视差、焦距以及第二摄像头与第三摄像头之间的基线距离确定挖斗深度信息,可见本发明能够根据挖斗位置信息确定挖斗深度信息。然后根据挖斗位置信息设置具有预设形状的滑动窗口,滑动窗口处于实时图像中挖斗的正下方。本发明一些实施例中初始的滑动窗口能够贴靠实时图像中的挖斗设置。然后控制滑动窗口按照设定位移竖直向下移动,将滑动窗口每次停留所覆盖的区域作为一个选取框,以实现基于挖斗位置信息在实时图像中挖斗的下方形成多个具有预设形状的选取框。本发明能够将选取框作为选定区域,以实现在实时图像上划分出选定区域。计算选定区域内的各像素点与挖斗中心的像素点的深度差,根据所述深度差形成像素区域,所以本发明能够实现从实时图像中查找到与挖斗深度信息匹配的像素区域。最后在视频中的实时图像上标记出像素区域,以形成挖斗在实时图像中地面上的投影。本发明一些实施例中在视频中的实时图像上标记出像素区域包括:通过增强现实方式对视频中的实时图像上的像素区域进行标记。
本发明还可提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本发明任一实施例中用于辅助驾驶挖掘机的方法的步骤。其中用于辅助驾驶挖掘机的方法包括:首先,获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像。其次,对实时图像进行目标识别处理,以从实时图像中提取出挖掘机的挖斗位置信息。目标为挖掘机的挖斗。本发明一些实施例对实时图像进行目标识别处理包括:利用训练完成的识别模型对实时图像中的挖斗进行识别;其中,通过已标注挖斗的多张图片训练卷积神经网络模型的方式得到识别模型。再次,根据挖斗位置信息计算挖斗在双目摄像头上的视差;其中,双目摄像头包括第二摄像头和第三摄像头,第二摄像头与第三摄像头具有相同的焦距;通过视差、焦距以及第二摄像头与第三摄像头之间的基线距离确定挖斗深度信息,可见本发明能够根据挖斗位置信息确定挖斗深度信息。然后根据挖斗位置信息设置具有预设形状的滑动窗口,滑动窗口处于实时图像中挖斗的正下方。本发明一些实施例中初始的滑动窗口能够贴靠实时图像中的挖斗设置。然后控制滑动窗口按照设定位移竖直向下移动,将滑动窗口每次停留所覆盖的区域作为一个选取框,以实现基于挖斗位置信息在实时图像中挖斗的下方形成多个具有预设形状的选取框。本发明能够将选取框作为选定区域,以实现在实时图像上划分出选定区域。计算选定区域内的各像素点与挖斗中心的像素点的深度差,根据所述深度差形成像素区域,所以本发明能够实现从实时图像中查找到与挖斗深度信息匹配的像素区域。最后在视频中的实时图像上标记出像素区域,以形成挖斗在实时图像中地面上的投影。本发明一些实施例中在视频中的实时图像上标记出像素区域包括:通过增强现实方式对视频中的实时图像上的像素区域进行标记。
综上所述,本发明能够在摄像头传回的实时图像中的地面上形成挖斗的投影,从而可满足挖掘机驾驶员通过挖斗投影更好地判断距离远近,以达到安全作业、精准作业以及科学作业等多个技术目的,挖掘机的驾驶员使用体验较佳,极大提升了驾驶员的满意度。另外,本发明所具体确定的投影位置是基于像素级的深度匹配而得到的,可见本发明技术方案还具有准确性较高、数据处理精度高以及可信赖度较强等突出优点,而且对远程操作挖掘机等基于画面进行大型机械设备控制的场景更为适用。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读存储介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM,Random Access Memory),只读存储器(ROM,Read-Only Memory),可擦除可编辑只读存储器(EPROM,Erasable Programmable Read-Only Memory,或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM,Compact Disc Read-Only Memory)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA,Programmable Gate Array),现场可编程门阵列(FPGA,Field Programmable Gate Array)等。
在本说明书的描述中,参考术语“本实施例”、“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明实质内容上所作的任何修改、等同替换和简单改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用于辅助驾驶挖掘机的方法,其特征在于,包括:
获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像;
对所述实时图像进行目标识别处理,以从所述实时图像中提取出所述挖掘机的挖斗位置信息;所述目标为所述挖掘机的挖斗;
根据所述挖斗位置信息确定挖斗深度信息;
从所述实时图像中查找到与所述挖斗深度信息匹配的像素区域;
在所述视频中的实时图像上标记出所述像素区域,以形成所述挖斗在所述实时图像中地面上的投影。
2.根据权利要求1所述的用于辅助驾驶挖掘机的方法,其特征在于,所述从所述实时图像中查找到与所述挖斗深度信息匹配的像素区域包括:
在所述实时图像上划分出选定区域;
计算所述选定区域内的各像素点与所述挖斗中心的像素点的深度差;
根据所述深度差形成所述像素区域。
3.根据权利要求2所述的用于辅助驾驶挖掘机的方法,其特征在于,所述在所述实时图像上划分出选定区域包括:
基于所述挖斗位置信息在所述实时图像中挖斗的下方形成多个具有预设形状的选取框;
将所述选取框作为所述选定区域。
4.根据权利要求3所述的用于辅助驾驶挖掘机的方法,其特征在于,所述基于所述挖斗位置信息在所述实时图像中挖斗的下方形成多个具有预设形状的选取框包括:
根据所述挖斗位置信息设置具有预设形状的滑动窗口,所述滑动窗口处于所述实时图像中挖斗的正下方;
控制所述滑动窗口按照设定位移竖直向下移动,将所述滑动窗口每次停留所覆盖的区域作为一个所述选取框。
5.根据权利要求1所述的用于辅助驾驶挖掘机的方法,其特征在于,所述根据所述挖斗位置信息确定挖斗深度信息包括:
根据所述挖斗位置信息计算挖斗在双目摄像头上的视差;
其中,所述双目摄像头包括第二摄像头和第三摄像头,所述第二摄像头与所述第三摄像头具有相同的焦距;
通过所述视差、所述焦距以及所述第二摄像头与所述第三摄像头之间的基线距离确定所述挖斗深度信息。
6.根据权利要求1所述的用于辅助驾驶挖掘机的方法,其特征在于,所述对所述实时图像进行目标识别处理包括:
利用训练完成的识别模型对所述实时图像中的挖斗进行识别;其中,通过已标注挖斗的多张图片训练卷积神经网络模型的方式得到所述识别模型。
7.根据权利要求1所述的用于辅助驾驶挖掘机的方法,其特征在于,所述在所述视频中的实时图像上标记出所述像素区域包括:
通过增强现实方式对所述视频中的实时图像上的像素区域进行标记。
8.一种用于辅助驾驶挖掘机的系统,其特征在于,包括:
实时图像获取模块,用于获取通过挖掘机上的第一摄像头拍摄的视频中的实时图像;
挖斗位置识别模块,用于对所述实时图像进行目标识别处理,以用于从所述实时图像中提取出所述挖掘机的挖斗位置信息;所述目标为所述挖掘机的挖斗;
挖斗深度计算模块,用于根据所述挖斗位置信息确定挖斗深度信息;
像素区域匹配模块,用于从所述实时图像中查找到与所述挖斗深度信息匹配的像素区域;
地面投影标记模块,用于在所述视频中的实时图像上标记出所述像素区域,以形成所述挖斗在所述实时图像中地面上的投影。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述用于辅助驾驶挖掘机的方法的步骤。
10.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至7中任一项权利要求所述用于辅助驾驶挖掘机的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110363100.0A CN113240733A (zh) | 2021-04-02 | 2021-04-02 | 一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110363100.0A CN113240733A (zh) | 2021-04-02 | 2021-04-02 | 一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113240733A true CN113240733A (zh) | 2021-08-10 |
Family
ID=77131058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110363100.0A Pending CN113240733A (zh) | 2021-04-02 | 2021-04-02 | 一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113240733A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114627454A (zh) * | 2022-03-18 | 2022-06-14 | 柳州柳工叉车有限公司 | 一种驾驶员举升意图感知方法、装置、设备及介质 |
CN114663351A (zh) * | 2022-02-22 | 2022-06-24 | 北京拓疆者智能科技有限公司 | 一种满斗率探测方法和系统 |
CN115514751A (zh) * | 2022-08-24 | 2022-12-23 | 网易(杭州)网络有限公司 | 用于挖掘机远程控制的图像获取方法及远程控制系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108951750A (zh) * | 2018-08-08 | 2018-12-07 | 上海宝冶集团有限公司 | 一种挖掘机施工作业方法、系统及挖掘机 |
CN111275923A (zh) * | 2020-01-22 | 2020-06-12 | 清华大学 | 施工现场的人机碰撞预警方法及系统 |
CN112180928A (zh) * | 2020-09-30 | 2021-01-05 | 上海三一重机股份有限公司 | 挖掘机控制方法、挖掘机控制装置及挖掘机 |
CN112424427A (zh) * | 2018-08-31 | 2021-02-26 | 株式会社小松制作所 | 作业机械的控制装置及控制方法 |
-
2021
- 2021-04-02 CN CN202110363100.0A patent/CN113240733A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108951750A (zh) * | 2018-08-08 | 2018-12-07 | 上海宝冶集团有限公司 | 一种挖掘机施工作业方法、系统及挖掘机 |
CN112424427A (zh) * | 2018-08-31 | 2021-02-26 | 株式会社小松制作所 | 作业机械的控制装置及控制方法 |
CN111275923A (zh) * | 2020-01-22 | 2020-06-12 | 清华大学 | 施工现场的人机碰撞预警方法及系统 |
CN112180928A (zh) * | 2020-09-30 | 2021-01-05 | 上海三一重机股份有限公司 | 挖掘机控制方法、挖掘机控制装置及挖掘机 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114663351A (zh) * | 2022-02-22 | 2022-06-24 | 北京拓疆者智能科技有限公司 | 一种满斗率探测方法和系统 |
CN114627454A (zh) * | 2022-03-18 | 2022-06-14 | 柳州柳工叉车有限公司 | 一种驾驶员举升意图感知方法、装置、设备及介质 |
CN114627454B (zh) * | 2022-03-18 | 2024-02-09 | 柳州柳工叉车有限公司 | 一种驾驶员举升意图感知方法、装置、设备及介质 |
CN115514751A (zh) * | 2022-08-24 | 2022-12-23 | 网易(杭州)网络有限公司 | 用于挖掘机远程控制的图像获取方法及远程控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113240733A (zh) | 一种用于辅助驾驶挖掘机的方法、系统、设备及存储介质 | |
US9824490B1 (en) | Augmentation of a dynamic terrain surface | |
EP3581890A2 (en) | Method and device for positioning | |
CN112793564B (zh) | 一种基于全景鸟瞰图和深度学习的自主泊车辅助系统 | |
JP6510247B2 (ja) | 測量データ処理装置、測量データ処理方法およびプログラム | |
EP2874097A2 (en) | Automatic scene parsing | |
JP4380838B2 (ja) | ビデオ画像の道路標識自動認識方法及び道路標識自動認識装置並びに道路標識自動認識プログラム | |
KR20210006511A (ko) | 차선 결정 방법, 디바이스 및 저장 매체 | |
KR100816589B1 (ko) | 화상 처리 장치 | |
CA2678156A1 (en) | Measurement apparatus, measurement method, and feature identification apparatus | |
WO2012084703A1 (en) | Detection and tracking of moving objects | |
CN108352070B (zh) | 移动体追踪方法、移动体追踪装置以及程序 | |
CN111837158A (zh) | 图像处理方法、装置、拍摄装置和可移动平台 | |
JP4521568B2 (ja) | 対応点探索方法、相互標定方法、3次元画像計測方法、対応点探索装置、相互標定装置、3次元画像計測装置、対応点探索プログラム及び対応点探索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
WO2024087962A1 (zh) | 车厢姿态识别系统、方法、电子设备及存储介质 | |
CN114782928A (zh) | 一种车位检测方法、装置、电子设备及存储介质 | |
JP2009217832A (ja) | ビデオ画像の道路標識自動認識方法及び道路標識自動認識装置並びに道路標識自動認識のプログラムを記憶した記憶媒体 | |
CN111047699A (zh) | 海底探测图像展示方法、装置、设备和存储介质 | |
EP3825804A1 (en) | Map construction method, apparatus, storage medium and electronic device | |
CN112833889B (zh) | 一种车辆的定位方法及装置 | |
CN115546221B (zh) | 一种钢筋计数方法、装置、设备及存储介质 | |
CN115909094A (zh) | 基于2d图像和视频融合的地下桩基施工进度识别方法 | |
JP2007218922A (ja) | 画像測定装置 | |
CN112492197A (zh) | 图像处理方法及相关设备 | |
CN115576330B (zh) | 实现单向潜伏牵引式agv和料车对接的方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |