CN116843946A

CN116843946A - 一种基于图像识别的隧道岩体主要结构面判识方法及装置

Info

Publication number: CN116843946A
Application number: CN202310635084.5A
Authority: CN
Inventors: 邹杨; 蒋良文; 伊小娟; 徐正宣; 张广泽; 杨科; 唐兴荣; 朱泳标; 史洪滨; 赵景锋; 周学军; 袁东
Original assignee: China Railway Eryuan Engineering Group Co Ltd CREEC
Current assignee: China Railway Eryuan Engineering Group Co Ltd CREEC
Priority date: 2023-05-31
Filing date: 2023-05-31
Publication date: 2023-10-03

Abstract

本发明涉及岩体结构面识别技术领域，特别涉及一种基于图像识别的隧道岩体主要结构面判识方法及装置，包括：获取开挖面图像并切片分割，基于预先训练好的岩体结构面迹线判识模型进行识别，获取带有预测迹线的图像，再进行聚类拟合处理，得到结构面迹线。本发明能够有效降低识别过程中对原始图像的要求，并能提高对于预测迹线的捕捉精度，避免过度拟合，并极大地消除了预测迹线上的噪音点，使获取的结构面迹线能够更加接近真实的结构面迹线，从而提升对迹线判识的精确度。

Description

一种基于图像识别的隧道岩体主要结构面判识方法及装置

技术领域

本发明涉及岩体结构面识别技术领域，特别涉及一种基于图像识别的隧道岩体主要结构面判识方法及装置。

背景技术

隧道工程是城市建设和交通基础设施建设中的重要组成部分，隧道岩体中的结构面是评价围岩稳定性及围岩级别需要重点考虑的因素之一。传统的结构面判识方法主要依靠地质人员经验和设备端识别，存在识别效率低、误差大等问题，不能满足实际需求。在上游管理端越来越精细化的当下，人工识别方式与管理需求存在巨大的效率鸿沟，自动化、智能化的现场施工方式正在逐步普及，而现场受制于施工环境，很难展开大中型设备，以隧道开挖面的岩体结构面识别设备为例，目前市场上已经有基于单反相机、激光雷达在内的多种专用设备，具备自动化建模、智能化判识的配套算法，但是这类设备和算法都需要展开并消耗现场施工人员大量时间去对角度、拍摄和建模，不仅设备阻碍了施工通道，带来较大的安全隐患，还浪费现场人员时间，严重耽误施工进度。

例如，申请公开号为CN115731390A的中国专利公开了一种灰岩隧道岩体结构面识别方法，该方法主要通过获取灰岩隧道掌子面的结构图像并依据算法得到该结构图像下的骨架线，再对所述骨架线进行直线化处理和像素级统计，得到每条骨架线的长度和视倾角。在骨架线的获取上，该方法通过腐蚀其结构面迹线并进行开运算，即得到结构面的骨架线，其中，简单的腐蚀和开运算过程，并不能精确识别及消除多余的噪音点，甚至会对原有的骨架线进行错误处理，导致获取的骨架线不准确；同时该方法中，对于获取的图像有一定的质量要求，这在施工过程中将对获取图像带来极大不便。

因此，亟需提出一种基于普通拍摄条件下，不需要浪费施工人员过多时间，甚至仅利用掌子面图像即可完成结构面判识，同时提升结构面判识效率和准确率，节约成本，并为同期开展的超前地质预报、综合地质分析等工序提供有利支撑。

发明内容

本发明的目的在于克服现有岩体结构面识别技术所存在的结构面迹线识别方法受获取的结构面图像质量影响较大、精度不高的问题，提供一种基于图像识别的隧道岩体主要结构面判识方法，能够对岩体开挖面普通影像进行识别，同时运用降噪技术对图像进行处理，并对迹线的迹线离散点集进行聚类和直线拟合，本方法通过对图像进行降噪处理并基于所配置的算法，提高了迹线判识的精度，对原始图像质量要求较低，工程实用性较高。

为了实现上述发明目的，本发明提供了以下技术方案：

一种基于图像识别的隧道岩体主要结构面判识方法，包括以下步骤：

S1、获取开挖面图像为第一图像，对所述第一图像进行切片分割，形成多个第二图像；

S2、基于预先训练好的岩体结构面迹线判识模型识别所述多个第二图像，形成多个第三图像，所述多个第三图像为二值图，并带有预测迹线；

S3、将所述多个第三图像拼接还原组成第四图像，所述第四图像与所述第一图像大小相等，为二值图，并带有预测迹线；

S4、对所述第四图像中的预测迹线进行聚类拟合处理，获取结构面迹线，所述聚类拟合处理包括基于密度的空间聚类算法处理和基于霍夫空间的直线拟合。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，所述S2具体包括：

S21、输入所述多个第二图像进行轮循，并对每个第二图像调用所述预先训练好的岩体结构面迹线判识模型进行预测，输出对应的预测图像；

S22、基于平均值池化处理所述预测图像，再对处理后的预测图像二值化，形成迹线预测图像；

S23、轮循结束后，得到每个第二图像对应的所有迹线预测图像，将所有迹线预测图像组合得到第三图像。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，通过以下步骤构建所述预先训练好的岩体结构面迹线判识模型，包括：

获取原始图像作为训练集，并进行人工标注；

采用交叉熵作为损失函数，用于计算每层损失并修改权重；

基于所述训练集对岩体结构面迹线判识初始模型进行训练，得到训练好的岩体结构面迹线判识模型。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，所述预先训练好的岩体结构面迹线判识模型包括5个3×3卷积层、对应的5个Relu函数激活层、对应的5个反卷积层、1个全连接层、1个1×1卷积层以及1个最大池化层。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，所述S4具体包括：

S41、设定基于密度的空间聚类算法参数，输入所述第四图像；

S42、结合所述第四图像中的信号区域，聚类属于同一迹线的点，得到若干分类组成的分类空间，所述分类空间的质心点为迹线点；

S43、基于霍夫空间轮循各个分类的分类空间，得到所有分类的拟合直线；

S44、对所述所有分类的拟合直线进行噪音过滤，得到结构面迹线。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，所述设定基于密度的空间聚类算法参数，具体包括样本的领域距离，以及该领域距离内的样本个数。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，所述S43具体包括：

S431、将若干分类组成的分类空间进行坐标转换，转换为极坐标霍夫空间；

S432以某个分类下的分类空间的质心点做直线，固定角度进行旋转，同时取该分类内其他分类空间的质心点到所述直线的距离；

S433、当所述距离不超过设定阈值时，所述直线上的点集数量加1，当达到最大旋转次数时，获取点集数量最大的直线，为该分类的拟合直线；

S434、重复步骤S432-S433，直到获取所有分类的拟合直线。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，所述对所述第一图像进行切片分割具体包括：获取第一图像的长度和宽度，并设定切片数量，以所述宽度与所述切片数量的比值进行切片分割；

所述S3中，根据所述切片数量和所述比值将所述多个第三图像拼接还原组成第四图像。

优选地，上述基于图像识别的隧道岩体主要结构面判识方法中，所述二值图中，0表示非迹线，1表示迹线。

本发明的另一方面，还提供了一种基于图像识别的隧道岩体主要结构面判识装置，其特征在于，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述任一项所述的一种基于图像识别的隧道岩体主要结构面判识方法。

与现有技术相比，本发明的有益效果：

本发明提供的一种基于图像识别的隧道岩体主要结构面判识方法，通过对获取到的图像进行切片分割，降低了原始图像过大带来的识别误差，进而降低对待识别图像的质量要求，提高了识别范围；在切片分割的基础上，通过预先训练好的岩体结构面迹线判识模型进行识别，在获取结构面的预测迹线上提高了捕捉精度，避免了过度拟合；再利用基于密度的空间聚类算法，极大地消除了预测迹线上的噪音点，使获取的结构面迹线能够更加接近真实的结构面迹线，从而提升了对迹线判识的精确度。

附图说明

图1为本发明在一种实施例中的流程图；

图2为本发明在一种实施例中的图像分割示意图；

图3为本发明在一种实施例中的岩体结构面迹线判识模型结构示意图；

图4为本发明在一种实施例中的预测输出图；

图5为本发明在一种实施例中的预测输出二值化图；

图6为本发明在一种实施例中的二值化拼接图；

图7为本发明在一种实施例中的直线拟合流程图；

图8为本发明在一种实施例中的结构面迹线判识结果示意图；

图9为本发明在一种实施例中的迹线标注软件示意图。

具体实施方式

下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例，凡基于本发明内容所实现的技术均属于本发明的范围。

实施例1

图1示出了本发明示例性实施例的基于图像识别的隧道岩体主要结构面判识方法，包括以下步骤：

S1、获取开挖面图像为第一图像，对所述第一图像进行切片分割，形成多个第二图像，降低了原始图像过大带来的识别误差，从而降低了图像要求，提高了识别范围；

S2、基于预先训练好的岩体结构面迹线判识模型识别所述多个第二图像，获取多个第三图像，所述多个第三图像为二值图，并带有预测迹线，提高了捕捉精度，避免了过度拟合；

可以理解的是，隧道开挖面岩体结构面判识，在隧道开挖过程中需要对岩体结构面进行判识，以便对隧道开挖面的岩体的稳定性及围岩级别进行评估，评估岩体稳定性及围级别的最重要的指标之一是岩体的完整程度，根据《铁路隧道超前地质预报技术规程》等相关规范，岩体完整程度主要取决于结构面发育特征，目前主要依靠现场地质人员现场进行人工判识并记录。

因此，为了实现通过新鲜揭露的开挖面影像判识岩体主要结构面的目的，本实施例提供一种基于图像识别的隧道岩体主要结构面判识方法，该方法通过切片分割获取的图像，降低了原始图像过大带来的识别误差，从而降低了图像要求，提高了识别范围；并通过预先训练好的岩体结构面迹线判识模型进行识别，在获取结构面的预测迹线上提高了捕捉精度，避免了过度拟合；再利用基于密度的空间聚类算法，极大地消除了预测迹线上的噪音点，使获取的结构面迹线能够更加接近真实的结构面迹线，从而提升了对迹线判识的精确度。

实施例2

在一种可能的实现方式中，上述S1具体包括：

S11、接收现场上传的图像，一般采用普通手机拍摄，记为第一图像。

S12、进一步的，对第一图像进行分割切片；

具体的，由于深度学习模型接收的图像为(224×224)，如果对第一图像采用压缩，则会因为图像变小而丢失语义，保持原始大小又会因为太大而无法处理，因此本实施例中，通过对第一图像进行分割切片确保不丢失语义信息。

如图3所示，上述S12，具体包括：

S121、图像切片。获取原始图像的长宽(h×w)，根据配置，图像按照窄边(w)分割为4块，即：kernel＝(w/4,w/4)，图像不足部分以(0,0,0)补齐。

S122、图像压缩。切片后的kernel大小仍然超过(224×224)，必须进行压缩。使用OpenCV库对图像进行压缩，并按照从上至下，从左至右的顺序，保存压缩后的多张切片，记为第二图像。为了便于后面重新拼接图像，还需要将原始大小(h×w)、切片大小(kernel)一并缓存并返回。

在一种可能的实现方式中，上述S2包括：基于深度学习的岩体迹线判识。其中，岩体结构面迹线判识，在机器视觉算法里对应边缘检测算法。传统算法有Canny算子、支持向量机等方法，本发明采用基于整体嵌套边缘检测(Holistically-nestededgedetection,HED)的神经网络，完成对岩体结构面迹线的判识。具体步骤如下：

S.21网络设计和损失函数。HED的技术原理主要是采用了VGG-16作为骨干网络，VGG-16是一种深度卷积神经网络(CNN)，由牛津大学视觉几何组的KarenSimonyan和AndrewZisserman于2014年提出。该网络具有16层深度，采用了相对较小的3×3卷积核，因此其命名为VGG-16。VGG-16是ImageNet图像分类竞赛中表现最好的模型之一。该网络在训练时使用了很小的过滤器，同时增加了网络的深度，这使得它能够更好地捕捉图像中的复杂特征。VGG-16还使用了最大池化层，以减少网络中的参数数量，从而避免过度拟合。在VGG-16中，卷积层和全连接层的结构均相同，只是它们的深度不同。网络的第一个卷积层使用64个3×3的卷积核，第二个卷积层使用128个3×3的卷积核，第三个卷积层使用256个3×3的卷积核，第四个卷积层使用512个3×3的卷积核，第五个卷积层也使用512个3×3的卷积核。每个卷积层之后都跟随一个最大池化层，以减少特征图的大小。在卷积层之后，VGG-16有三个全连接层。第一个全连接层具有4096个神经元，第二个全连接层也有4096个神经元，最后一个全连接层有1000个神经元，对应于ImageNet数据集中的1000个类别。VGG-16已经成为图像分类中经典的深度学习模型之一，并被广泛应用于图像识别、目标检测和图像分割等领域。网络设计采用了5层卷积层，每层具有不同数量的(3×3)卷积核，并采用ReLU作为激活函数，与VGG-16略显不同的是，每层卷积层后跟随了一个反卷积，然后才是由最大池化层实现下采样并进入下一层。中途反卷积的图像会被保存下来，作为不同维度特征一起传入全连接层，最后通过一个(1×1)的卷积核将图片像素的5个通道降为1个通道。训练阶段，HED采用交叉熵作为损失函数，可以做到在每层计算损失并修改权重。总体而言，HED的架构并不复杂，但是由于中间5层权重，导致训练时间长，产生的模型也较之其他模型占空间更大。HED网络及优化结构如图3所示。

S.22迹线标注。从HED网络来看，其返回的是一维数据，因此在训练集标注阶段，需要对岩体图像迹线标注结果进行归一化，最简单的办法就是生成一个黑白色的二值图，由黑色像素表示非迹线，白色像素表示迹线。本发明在训练阶段总共标注了2000张图像，并利用数据增强，如修改光照、放大和截图等方法，标注了其余2000多张图像，总共标注图像接近5000张。

S.23训练。在大量训练集基础上，重新训练岩体迹线判识模型，并持久化为H5模型文件。

S.24预测。输入第二图像，轮循第二图像，对每个第二图像调用预测函数，传入模型文件，输出预测图像，如图4所示。

S.25池化。由于预测图像里噪音点较多，需继续进行平均值池化，去掉噪音点，再对处理后的图像二值化。形成迹线预测图像，效果如图5所示。轮循结束后，所有迹线预测图像组成第三图像。

在一种可能的可能的实现中，上述S3、图像拼接还原，具体包括：岩体迹线判识步骤产生的第三图像只代表了一小部分区域，应将所有小图重新拼接，并还原至第一图像的大小：

S31、图像拼接。按照长宽比和窄边4张图为一组的逻辑，将第三图像重新组装。

S32、图像还原。根据缓存的原始大小(h×w)和切片大小(kernel)，换算好比例，对组装好的图像进行先裁剪再拉伸，组成原始图像大小的二值图，记为第四图像，该二值图中0仍然表示非迹线，1表示迹线。最终二值图，如图6所示。

在一种可能的实现方式中，上述S4具体包括：基于密度的空间聚类算法和基于霍夫空间的直线拟合。聚类分析是分类统计的延伸，以对象的相似性为基础，将样本数据中相似分类的样本点归集起来。聚类算法常见的有K-means、BIRCH、DBSCAN等算法。不同的算法在应对不同的聚类需求、样本条件上效果不一，需要根据具体情况选择最适合的算法。以DBSCAN为例，其是一种基于密度的聚类算法，核心思想是将所有数据点分为三种类型：核心点(Core Point)、边界点(BorderPoint)和噪声点(NoisePoint)，首先随机选择一个未被访问过的点，将其标记为已访问，然后寻找其eps邻域内的所有点。如果该点是一个核心点，则将其与其所有eps邻域内的点归为同一类别，并且递归地寻找每个点的eps邻域。如果该点是边界点，则将其与核心点归为同一类别。最终，未被访问过的点被标记为噪声点。直线拟合算法是计算机视觉领域中常用的一种算法，它可以在图像中自动识别出直线，从而实现图像处理和分析的目的。常用的直线拟合算法包括：最小二乘法、RANSAC、霍夫直线。直线拟合算法在计算机视觉领域中被广泛应用，例如边缘检测、目标跟踪、图像拼接等。以霍夫直线(HoughLine)为例，其核心思想就是霍夫变换，将直角坐标变换为极坐标：yi＝θxi+c，θ和c都为变量，通过一点(x1，y1)有无数条直线，也就是有无数个θ和c，而通过共线直线的另外一个点(x2，y2)的θ和c势必和(x1，y1)相同，这样直线拟合问题就变为在斜率和截距空间里的查找最多共线的点问题。

具体地，如上述S4所述，迹线识别后的结果并不能直接形成直线，相反由于在前面二值化过程中，信号较强和信号一般的点都被认为是迹线信号，产生了大量的离散点，导致第一图像中的迹线在第四图像中表现为一大块白色的区域。需要对这类区域进行聚类，将可能属于同一迹线的点集合起来。

4.1距离和密度。结合二值图(第四图像)的信号区域，采用DBSCAN是最好的聚类方法，原因在于同一迹线的区域相对独立，区域内、沿迹线方向点排列分布密集，基于密度的算法能够很好的发现并归纳这些离散点，其次DBSCAN不需要事先指定聚类数量，而是根据数据的本身分布特点，自动确定聚类数目，利于发现最大数量的迹线区域。DBSCAN的密度是基于邻域距离来计算的，具体而言是指邻域距离eps内所有点都标记为同一类别，再在这些点之间继续递归，查找领域距离eps内的其他离散点，直到所有的点完成分类或者标记为噪音点。

4.2聚类实现。根据多次实验和测试，本发明选定eps＝10，min_samples＝5作为DBSCAN的参数，其中，eps为领域距离，min_sampleswei为该领域距离内的样本个数，在二值图(第四图像)上实现了DBSCAN聚类，得到若干个分类组成的分类空间T。

4.3霍夫变换。直角坐标系(x，y)空间中，每条直线y＝θx+c可以由两个参数确认，斜率θ和截距c，如果将θ，c看成是自变量，有c＝-xθ+y，这个(θ，c)空间就是霍夫空间，由直角坐标系到极坐标的霍夫空间的转换成为霍夫变换。

4.4直线拟合实现迹线。在分类空间T中，轮循各分类，取该分类的质心点，以该点为中心做直线并逆时针方向旋转0到180°，步长为1°，每旋转1°，取分类内其他点，求与该直线距离d，当d在阈值范围内，则认为该点位于直线上，直线上的点集数量加1，最后统计180次旋转中点集数量最多的直线为该分类的拟合直线。继续下一个分类直到分类结束。流程如图7所示。

4.5主要结构面过滤。去掉距离过短的直线段，筛选后的直线段可以认为是主要结构面在开挖面上的迹线，效果如图8所示。

实施例3

本发明的另一方面，还提供了一种基于图像识别的隧道岩体主要结构面判识装置，其特征在于，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述任一项所述的一种基于图像识别的隧道岩体主要结构面判识方法。

基于上述技术方案，在本实施例中，利用预设好的处理器，其中的WinForm程序能够实现一个简单的岩体迹线标注软件，如图9所示。同时本实施例中，获取的最终结构面迹线能够进行结果返回，为了结合现场各类应用，如超前地质预报系统，本实施例将预测过程封装为HTTP接口调用，通过POST方式传入新鲜揭露的开挖面影像，返回结构面在原始图像上的直线顶点坐标，由相关系统绘制出或用于其他业务。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于图像识别的隧道岩体主要结构面判识方法，其特征在于，包括以下步骤：

S1、获取开挖面图像，记为第一图像，对所述第一图像进行切片分割，形成多个第二图像；

2.根据权利要求1所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，所述S2具体包括：

3.根据权利要求1所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，通过以下步骤构建所述预先训练好的岩体结构面迹线判识模型，包括：获取原始图像作为训练集，并进行人工标注；

采用交叉熵作为损失函数，用于计算每层损失并修改权重；

4.根据权利要求1所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，所述预先训练好的岩体结构面迹线判识模型包括5个3×3卷积层、对应的5个Relu函数激活层、对应的5个反卷积层、1个全连接层、1个1×1卷积层以及1个最大池化层。

5.根据权利要求1～4任一所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，所述S4具体包括：

6.根据权利要求5所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，所述基于密度的空间聚类算法参数，包括：样本的领域距离，以及该领域距离内的样本个数。

7.根据权利要求5所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，所述S43具体包括：

S434、重复步骤S432-S433，直到获取所有分类的拟合直线。

8.根据权利要求1所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，所述对所述第一图像进行切片分割具体包括：获取第一图像的长度和宽度，并设定切片数量，以所述宽度与所述切片数量的比值进行切片分割；

9.根据权利要求1所述的基于图像识别的隧道岩体主要结构面判识方法，其特征在于，所述二值图中，0表示非迹线，1表示迹线。

10.一种基于图像识别的隧道岩体主要结构面判识装置，其特征在于，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至9中任一项所述的方法。