CN105354600A - 一种砂岩显微薄片的自动分类方法 - Google Patents
一种砂岩显微薄片的自动分类方法 Download PDFInfo
- Publication number
- CN105354600A CN105354600A CN201510628405.4A CN201510628405A CN105354600A CN 105354600 A CN105354600 A CN 105354600A CN 201510628405 A CN201510628405 A CN 201510628405A CN 105354600 A CN105354600 A CN 105354600A
- Authority
- CN
- China
- Prior art keywords
- sandstone
- sigma
- image
- slice image
- microsection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000012549 training Methods 0.000 claims abstract description 62
- 239000013598 vector Substances 0.000 claims abstract description 62
- 229910052500 inorganic mineral Inorganic materials 0.000 claims abstract description 48
- 239000011707 mineral Substances 0.000 claims abstract description 48
- 239000002245 particle Substances 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000007637 random forest analysis Methods 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 5
- 238000007670 refining Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012952 Resampling Methods 0.000 claims description 9
- 239000012141 concentrate Substances 0.000 claims description 6
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000003709 image segmentation Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 abstract 1
- 238000007781 pre-processing Methods 0.000 abstract 1
- 239000010433 feldspar Substances 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 239000010453 quartz Substances 0.000 description 5
- 239000004576 sand Substances 0.000 description 5
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 5
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000003345 natural gas Substances 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 239000010445 mica Substances 0.000 description 1
- 229910052618 mica group Inorganic materials 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种砂岩显微薄片的自动分类方法,其步骤是:1)对砂岩的显微薄片图像进行预处理,分割矿物颗粒;2)以颗粒为单位分别提取纹理和形状特征,选择代表颗粒,构成薄片图像的特征向量;3)对目标地域的砂岩薄片,基于欧氏距离采用近邻法选择相似的砂岩薄片样本,构建训练集合;4)精化训练集数据,包括类间平衡和特征降维;5)训练随机森林分类器,预测砂岩薄片的种类。本方法运用图像处理技术和机器学习方法,自动鉴别来自不同地域的砂岩薄片种类,能够解决由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题。
Description
技术领域
本发明涉及不同地域砂岩显微薄片的自动分类问题,特别针对地域不同导致的砂岩薄片结构差异较大而难于互相借鉴,运用图像处理技术和机器学习方法,实现不同地域砂岩薄片的自动分类。
背景技术
砂岩是一种主要由砂粒胶结而成的陆源沉积岩,主要由石英和长石组成。按照其成分和成因可划分为:石英砂岩、长石砂岩和岩屑砂岩三大类。砂岩是一种使用最广泛的建筑用石材,还是石油和天然气的储集层,砂岩的分类在油气和矿物勘探等领域有重要意义。
砂岩薄片分类根据砂岩的纹理和形状特征,确定砂岩薄片的种类,进而确定其结构、来源和成因。现有砂岩薄片分类方法多采用人工,费时费力,且过度依赖个人经验,不可重复。另外,由于形成的地质地域或环境不同,不同地域砂岩的结构差异较大,给砂岩薄片的分类带来了很大困难。
发明内容
本发明所要解决的技术问题是提供一种砂岩显微薄片的自动分类方法,该方法运用图像处理技术和机器学习方法实现对不同地域砂岩显微薄片的自动分类。
为达到上述目的,本方法采用如下的步骤:
1)读取砂岩显微薄片图像,对其进行滤波、去噪、平滑等预处理;采用图像分割技术,对砂岩显微薄片图像进行区域分割,获得矿物颗粒图像;
2)基于砂岩显微薄片图像中的矿物颗粒,分别计算纹理和形状特征指标,构建薄片图像的特征向量;
3)对目标地域的砂岩薄片图像,计算其特征向量,采用近邻法选择若干个相似的有标注的砂岩薄片图像样本,构建训练集合;
4)精化训练集数据:采用随机取样方法对初始训练集中少数类的样本进行重采样,实现训练集数据的类间平衡;分别计算每个特征指标的ANOVAF值,设定百分比,排除不必要的特征指标;
5)训练随机森林分类器,以目标地域砂岩薄片图像为输入,自动预测其种类。
上述步骤2)中基于砂岩显微薄片图像的矿物颗粒构建薄片图像的特征向量的处理过程是:首先针对薄片图像中的每个矿物颗粒,分别计算纹理特征和形状特征指标,组成矿物颗粒的特征向量X;然后对所有矿物颗粒的特征向量加权平均,得到均值特征向量Xm,计算公式如下:
其中k为薄片图像中包含的矿物颗粒总数;再后选取前K个面积最大的矿物颗粒的特征向量Xi(i∈[1,K]);最后将X1,X2,...,XK,Xm串接,构成薄片图像的特征向量。
上述步骤2)中计算矿物颗粒的纹理特征的处理过程是:首先将颗粒图像转换为灰度图像,计算位移矢量d分别为(1,0)、(1,1)、(0,1)以及(-1,1)的4个归一化灰度共生矩阵P:矩阵P是一个256×256的矩阵,其第i行第j列的矩阵元素p[i,j](0≤i≤255,0≤j≤255)代表按矢量d分离的像素对的个数除以颗粒图像的总像素数量,像素对中第一个像素的灰度值为i,另一个像素的灰度值为j;分别按照4个位移矢量计算,共得到4个灰度共生矩阵;
然后针对每一个灰度共生矩阵P,计算能量Energy、熵Entropy、对比度Contrast以及相关系数Correlation指标,计算公式如下,其中p[i,j](0≤i≤255,0≤j≤255)代表矩阵P中元素:
基于4个灰度共生矩阵,每个矿物颗粒获得16个纹理特征值。
上述步骤2)中计算矿物颗粒的形状特征的处理过程是:首先计算颗粒图像中包含的像素点总数,即颗粒的区域面积A;统计其边界像素点的个数,即区域周长C;然后求颗粒区域的凸包,指包含颗粒的最小凸多边形;计算凸包面积H,即凸包所包含的像素点总数;据以计算凸包差CD和密制度Solidity指标,计算公式如下:
CD=H-A
Solidity=A/H
接下来求包含颗粒区域的最小外接矩形,计算其面积ERA,即外接矩形包含的像素点数量;从而获得每个矿物颗粒的5个形状特征值:区域面积A、周长C、凸包差CD、密致度Solidity、以及外接矩形面积ERA;合并形状特征和纹理特征,每个矿物颗粒转换为包含21个特征值的特征向量X。
上述步骤3)中基于目标地域砂岩薄片图像的特征向量,采用近邻法构建训练集的计算过程是:对目标地域的砂岩薄片图像,首先计算其特征向量与现有样本集中各砂岩薄片图像特征向量的欧氏距离;给定两个特征向量X1=<x11,x12,...,x1m>和X2=<x21,x22,...,x2m>,其欧氏距离的计算公式如下:
其中x1i和x2i分别表示特征向量X1和X2的第i个特征指标值,m为特征向量中特征变量的总数;
然后按照距离递增顺序对样本集中各砂岩薄片图像排序,选取前s个相似的带标注砂岩薄片图像,构建训练集;如果有多张目标砂岩薄片图像,则分别针对每一张薄片图像,从样本集中选取s个近邻薄片图像,取其合集构成训练集。
上述步骤4)中采用重采样技术完成训练集类间平衡的处理过程是:首先统计训练集中各类砂岩薄片图像的数量;选择数量最多的砂岩种类,以其数量为基准值;如果其他种类的薄片图像数量少于基准值的80%,则采用随机重采样技术,创建该种类薄片图像的复本,直至数量达到基准值的80%。
上述步骤4)中计算每个特征指标的ANOVAF值,排除不必要特征指标的处理过程是:首先基于训练集中每一个特征指标,计算其ANOVAF值,公式如下:
其中i表示特征指标的序号,m表示特征指标的数量,即薄片图像特征向量的长度;n表示训练集中薄片图像实例的数量;μi表示特征指标i的均值;μ表示训练集中所有指标值的均值;xij表示特征指标i在第j个图像实例中的指标值;
然后设定百分比,保留30%的特征指标,计算要保留的特征指标数量M;
随后删除ANOVAF值最小的特征指标,如果剩余的特征指标数量大于M,则重新计算特征指标的ANOVAF值,重复删除过程;最后得到精化后的训练集。
上述步骤5)中采用随机森林分类器自动预测砂岩薄片种类的计算过程是:首先在训练集上训练随机森林分类器;然后基于目标地域砂岩显微薄片图像的特征向量,删除其中不必要的特征指标,即训练集精化过程中删除的特征指标集,作为输入由随机森林分类器预测砂岩薄片的种类。
本发明方法基于砂岩显微薄片图像,运用图像处理技术和机器学习方法,充分利用砂岩纹理清晰,颗粒形状独特的特性,提取纹理和形状特征指标,适用于砂岩的自动分类;特别针对由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题,本发明提出基于欧氏距离采用近邻法选择与目标砂岩薄片相似的薄片图像样本构建训练集,并对训练集数据进行精化,训练随机森林分类器,从而达到理想的分类效果。本发明方法计算简单,具有扩展性,分类效率高,可有效降低砂岩分类时间和成本,可随着砂岩薄片数据储备的增加而提高自动分类的准确性;在油气勘探、砂岩分类和矿物鉴别中具有应用价值。
附图说明
图1是不同地域砂岩显微薄片自动分类方法的总体框架;
图2是岩石学领域砂岩分类的三角图;
图3是来自不同地域的石英砂岩和长石砂岩显微薄片示意图;
图4是基于砂岩显微薄片构建并精化训练集的处理流程图。
具体实施方式
本发明的主要目的是实现对不同地域砂岩显微薄片的自动分类,运用图像处理技术和机器学习方法,以矿物颗粒为单位统计纹理及形状特征,构成薄片图像的特征向量,基于欧氏距离采用近邻法选择与目标砂岩薄片样本相似的薄片样本构建训练集,并对训练集数据进行精化,训练随机森林分类器,自动预测目标地域砂岩薄片的种类。
图1所示为不同地域砂岩显微薄片自动分类方法的技术框架。方法的输入是砂岩显微薄片图像;方法的输出是砂岩薄片的种类(石英砂岩、长石砂岩或者岩屑砂岩)。为保证方法的正确应用,需要预先制备砂岩显微薄片图像的样本数据集,并在数据集中标注每张薄片图像属于哪一类砂岩。技术框架分为5个步骤:首先对砂岩的显微薄片图像进行预处理,分割矿物颗粒;再以颗粒为单位分别提取纹理和形状特征,构成薄片图像的特征向量;对目标地域的砂岩薄片,基于欧氏距离采用近邻法构建训练集;然后应用类间平衡、特征降维方法精化训练集数据;最后训练随机森林分类器,预测目标砂岩薄片的种类。
图2所示为岩石学领域砂岩分类的三角图。砂岩是一种陆源沉积岩,主要由砂粒胶结而成。绝大部分砂岩由石英和长石组成。砂岩按照其成分和成因可划分为:石英砂岩、长石砂岩和岩屑砂岩三大类。石英砂岩中,石英和各种硅质岩屑的含量占砂级岩屑总量的90%以上,仅含少量或不含长石、岩屑和重矿物;长石砂岩中,碎屑成分主要是石英和长石,其中长石碎屑含量占砂级岩屑总量的25%以上,石英含量低于75%,可能包含较多的云母和重矿物;岩屑砂岩中,岩屑含量占砂级碎屑总量的25%以上,石英含量低于75%,并可含少量长石(低于25%),重矿物含量较高且种类复杂。砂岩是一种使用最广泛的建筑用石材,还是石油和天然气的储集层,砂岩的分类在油气和矿物勘探等方面有重要意义。
图3所示为来自不同地域的石英砂岩和长石砂岩显微薄片的对比图。从图中可以看出,不同地域不同种类砂岩由于其组成成分相同,颜色相似,不容易从颜色上进行区分;但是,砂岩通常具有较为清晰和丰富的纹理和颗粒形状,适于通过纹理和形状特征予以分类;由于形成的地质地域或环境不同,不同地域砂岩的结构差异较大,相互之间难于借鉴;例如图3中山南地区的长石砂岩与日喀则地区长石砂岩有明显的不同,反而在结构上与日喀则地区石英砂岩类似,而日喀则地区石英砂岩与那曲地区石英砂岩也完全不同;给砂岩显微薄片的自动分类带来了很大困难。
因此,本发明提出基于欧氏距离采用近邻法选择与目标砂岩薄片样本相似的薄片样本构建训练集,并对训练集数据进行精化,训练随机森林分类器,从而达到更好的分类效果。本发明采用的步骤如下:
1)读取砂岩显微薄片图像,对其进行滤波、去噪、平滑等预处理;采用图像分割技术,对砂岩显微薄片图像进行区域分割,获得矿物颗粒图像;
2)基于砂岩显微薄片图像中的矿物颗粒,分别计算纹理和形状特征指标,构建薄片图像的特征向量;
3)对目标地域的砂岩薄片图像,计算其特征向量,采用近邻法选择若干个相似的有标注的砂岩薄片图像样本,构建训练集合;
4)精化训练集数据:采用随机取样方法对初始训练集中少数类的样本进行重采样,实现训练集数据的类间平衡;分别计算每个特征指标的ANOVAF值,设定百分比,排除不必要的特征指标;
5)训练随机森林分类器,以目标地域砂岩薄片图像为输入,自动预测其种类。
上述步骤2)中基于砂岩显微薄片图像的矿物颗粒构建薄片图像的特征向量的处理过程是:首先针对薄片图像中的每个矿物颗粒,分别计算纹理特征和形状特征指标,组成矿物颗粒的特征向量X;然后对所有矿物颗粒的特征向量加权平均,得到均值特征向量Xm,计算公式如下:
其中k为薄片图像中包含的矿物颗粒总数;再后选取前K个面积最大的矿物颗粒的特征向量Xi(i∈[1,K]);最后将X1,X2,...,XK,Xm串接,构成薄片图像的特征向量。
上述步骤2)中计算矿物颗粒的纹理特征的处理过程是:首先将颗粒图像转换为灰度图像,计算位移矢量d分别为(1,0)、(1,1)、(0,1)以及(-1,1)的4个归一化灰度共生矩阵P:矩阵P是一个256×256的矩阵,其第i行第j列的矩阵元素p[i,j](0≤i≤255,0≤j≤255)代表按矢量d分离的像素对的个数除以颗粒图像的总像素数量,其中第一个像素的灰度值为i,另一个像素的灰度值为j;分别按照4个位移矢量计算,可以得到4个灰度共生矩阵;
然后针对每一个灰度共生矩阵P,计算能量Energy、熵Entropy、对比度Contrast以及相关系数Correlation指标,计算公式如下,其中p[i,j](0≤i≤255,0≤j≤255)代表矩阵P中元素:
基于4个灰度共生矩阵,每个矿物颗粒获得16个纹理特征值。
上述步骤2)中计算矿物颗粒的形状特征的处理过程是:首先计算颗粒图像中包含的像素点总数,即颗粒的区域面积A;统计其边界像素点的个数,即区域周长C;然后求颗粒区域的凸包,指包含颗粒的最小凸多边形;计算凸包面积H,即凸包所包含的像素点总数;据以计算凸包差CD和密制度Solidity指标,计算公式如下:
CD=H-A(10)
Solidity=A/H(11)
接下来求包含颗粒区域的最小外接矩形,计算其面积ERA,即外接矩形包含的像素点数量;从而获得每个矿物颗粒的5个形状特征值:区域面积A、周长C、凸包差CD、密致度Solidity、以及外接矩形面积ERA;合并形状特征和纹理特征,每个矿物颗粒转换为包含21个特征值的特征向量X。
上述步骤3)中基于目标地域砂岩薄片图像的特征向量,采用近邻法构建训练集的计算过程是:按图4所示,对目标地域的砂岩薄片图像,首先计算其特征向量与现有样本集中各砂岩薄片图像特征向量的欧氏距离,给定两个特征向量X1=<x11,x12,...,x1m>和X2=<x21,x22,...,x2m>,其欧氏距离的计算公式如下:
其中x1i和x2i分别表示特征向量X1和X2的第i个特征指标值,m为特征向量中特征变量的总数;
然后按照距离递增顺序对样本集中各砂岩薄片图像排序,选取前s个相似的带标注砂岩薄片图像,构建训练集;如果有多张目标砂岩薄片图像,则分别针对每一张薄片图像,从样本集中选取s个近邻薄片图像,取其合集构成训练集。
上述步骤4)中采用重采样技术完成训练集类间平衡的处理过程是:首先统计训练集中各类砂岩薄片图像的数量;选择数量最多的砂岩种类,以其数量为基准值;如果其他种类的薄片图像数量少于基准值的80%,则采用随机重采样技术,创建该种类薄片图像的复本,直至数量达到基准值的80%。
上述步骤4)中计算每个特征指标的ANOVAF值,排除不必要特征指标的处理过程是:如图4所示,首先基于训练集中每一个特征指标,计算其ANOVAF值,公式如下:
其中i表示特征指标的序号,m表示特征指标的数量,即薄片图像特征向量的长度;n表示训练集中薄片图像实例的数量;μi表示特征指标i的均值;μ表示训练集中所有指标值的均值;xij表示特征指标i在第j个图像实例中的指标值;
然后设定百分比,保留30%的特征指标,计算要保留的特征指标数量M;
随后删除ANOVAF值最小的特征指标,如果剩余的特征指标数量大于M,则重新计算特征指标的ANOVAF值,重复删除过程;最后得到精化后的训练集。
上述步骤5)中采用随机森林分类器自动预测砂岩薄片种类的计算过程是:首先在训练集上训练随机森林分类器;然后基于目标地域砂岩显微薄片图像的特征向量,删除其中不必要的特征指标,即训练集精化过程中删除的特征指标集,作为输入由随机森林分类器预测砂岩薄片的种类。
本发明方法充分利用砂岩纹理清晰,颗粒形状独特的特性,提取纹理和形状特征指标,适用于砂岩的自动分类;特别针对由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题,本发明提出基于欧氏距离采用近邻法选择与目标砂岩薄片相似的薄片图像样本构建训练集,并对训练集数据进行精化,训练随机森林分类器,从而达到理想的分类效果。通过收集西藏地区不同地域的砂岩薄片图像作为实验数据,实验结果表明本发明方法对不同地域砂岩薄片分类具有较高的准确性:精度达到89.3%,能够达到地质勘探的基本要求。另外,本发明方法具有较好的扩展性:其一可以采用其他的机器学习技术;其二通过砂岩薄片数据的不断储备,可以进一步提高砂岩分类的准确性。
本发明方法的具体应用途径很多,以上所述仅是本发明的优选实施方式。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些改进也应视为本发明的保护范围。
Claims (8)
1.一种砂岩显微薄片的自动分类方法,其特征在于包括以下步骤:
1)读取砂岩显微薄片图像,对其进行预处理;之后采用图像分割技术对砂岩显微薄片图像进行区域分割,获得矿物颗粒图像;
2)基于砂岩显微薄片图像中的矿物颗粒,分别计算纹理和形状特征指标,构建薄片图像的特征向量;
3)对目标地域的砂岩薄片图像,计算其特征向量,采用近邻法选择若干个相似的有标注的砂岩薄片图像样本,构建训练集合;
4)精化训练集数据:采用随机取样方法对初始训练集中少数类的样本进行重采样,实现训练集数据的类间平衡;分别计算每个特征指标的ANOVAF值,设定百分比,排除不必要的特征指标;
5)训练随机森林分类器,以目标地域砂岩薄片图像为输入,自动预测其种类。
2.根据权利要求1所述的砂岩显微薄片的自动分类方法,其特征在于,
上述步骤2)基于砂岩显微薄片图像的矿物颗粒构建薄片图像的特征向量的处理过程是:首先针对薄片图像中的每个矿物颗粒,分别计算纹理特征和形状特征指标,组成矿物颗粒的特征向量X;然后对所有矿物颗粒的特征向量加权平均,得到均值特征向量Xm,计算公式如下:
其中k为薄片图像中包含的矿物颗粒总数;再后选取前K个面积最大的矿物颗粒的特征向量Xi(i∈[1,K]);最后将X1,X2,...,XK,Xm串接,构成薄片图像的特征向量。
3.根据权利要求2所述的砂岩显微薄片的自动分类方法,其特征在于,
上述步骤2)中计算矿物颗粒的纹理特征指标的处理过程是:首先将颗粒图像转换为灰度图像,计算位移矢量d分别为(1,0)、(1,1)、(0,1)以及(-1,1)的4个归一化灰度共生矩阵P:矩阵P是一个256×256的矩阵,其第i行第j列的矩阵元素p[i,j](0≤i≤255,0≤j≤255)代表按矢量d分离的像素对的个数除以颗粒图像的总像素数量,像素对中第一个像素的灰度值为i,另一个像素的灰度值为j;分别按照4个位移矢量计算,共得到4个灰度共生矩阵;
然后针对每一个灰度共生矩阵P,计算能量Energy、熵Entropy、对比度Contrast以及相关系数Correlation指标,计算公式如下,其中p[i,j](0≤i≤255,0≤j≤255)代表矩阵P中元素:
基于4个灰度共生矩阵,每个矿物颗粒获得16个纹理特征值。
4.根据权利要求3所述的砂岩显微薄片的自动分类方法,其特征在于,
上述步骤2)中计算矿物颗粒的形状特征指标的处理过程是:首先计算颗粒图像中包含的像素点总数,即颗粒的区域面积A;统计其边界像素点的个数,即区域周长C;然后求颗粒区域的凸包,指包含颗粒的最小凸多边形;计算凸包面积H,即凸包所包含的像素点总数;据以计算凸包差CD和密制度Solidity指标,计算公式如下:
CD=H-A
Solidity=A/H
接下来求包含颗粒区域的最小外接矩形,计算其面积ERA,即外接矩形包含的像素点数量;从而获得每个矿物颗粒的5个形状特征值:区域面积A、周长C、凸包差CD、密致度Solidity、以及外接矩形面积ERA;合并形状特征和纹理特征,每个矿物颗粒转换为包含21个特征值的特征向量X。
5.根据权利要求4所述的砂岩显微薄片的自动分类方法,其特征在于,
上述步骤3)的过程是:对目标地域的砂岩薄片图像,首先计算其特征向量与现有样本集中各砂岩薄片图像特征向量的欧氏距离;给定两个特征向量X1=<x11,x12,...,x1m>和X2=<x21,x22,...,x2m>,其欧氏距离的计算公式如下:
其中x1i和x2i分别表示特征向量X1和X2的第i个特征指标值,m为特征向量中特征变量的总数;
然后按照距离递增顺序对样本集中各砂岩薄片图像排序,选取前s个相似的带标注砂岩薄片图像,构建训练集;如果有多张目标砂岩薄片图像,则分别针对每一张薄片图像,从样本集中选取s个近邻薄片图像,取其合集构成训练集。
6.根据权利要求5所述的砂岩显微薄片的自动分类方法,其特征在于,
上述步骤4)中采用重采样技术完成训练集类间平衡的处理过程是:首先统计训练集中各类砂岩薄片图像的数量;选择数量最多的砂岩种类,以其数量为基准值;如果其他种类的薄片图像数量少于基准值的80%,则采用随机重采样技术,创建该种类薄片图像的复本,直至数量达到基准值的80%。
7.根据权利要求6所述的砂岩显微薄片的自动分类方法,其特征在于,
上述步骤4)中计算每个特征指标的ANOVAF值,排除不必要特征指标的处理过程是:首先基于训练集中每一个特征指标,计算其ANOVAF值,公式如下:
其中i表示特征指标的序号,m表示特征指标的数量,即薄片图像特征向量的长度;n表示训练集中薄片图像实例的数量;μi表示特征指标i的均值;μ表示训练集中所有指标值的均值;xij表示特征指标i在第j个图像实例中的指标值;
然后设定百分比,保留30%的特征指标,计算要保留的特征指标数量M;
随后删除ANOVAF值最小的特征指标,如果剩余的特征指标数量大于M,则重新计算特征指标的ANOVAF值,重复删除过程;最后得到精化后的训练集。
8.根据权利要求7所述的砂岩显微薄片的自动分类方法,其特征在于,上述步骤5)中采用随机森林分类器自动预测砂岩薄片种类的计算过程是:首先在训练集上训练随机森林分类器;然后基于目标地域砂岩显微薄片图像的特征向量,删除其中不必要的特征指标,即训练集精化过程中删除的特征指标集,作为输入由随机森林分类器预测砂岩薄片的种类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510628405.4A CN105354600B (zh) | 2015-09-28 | 2015-09-28 | 一种砂岩显微薄片的自动分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510628405.4A CN105354600B (zh) | 2015-09-28 | 2015-09-28 | 一种砂岩显微薄片的自动分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105354600A true CN105354600A (zh) | 2016-02-24 |
CN105354600B CN105354600B (zh) | 2018-10-23 |
Family
ID=55330567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510628405.4A Active CN105354600B (zh) | 2015-09-28 | 2015-09-28 | 一种砂岩显微薄片的自动分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105354600B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485223A (zh) * | 2016-10-12 | 2017-03-08 | 南京大学 | 一种砂岩显微薄片中岩石颗粒的自动识别方法 |
CN106557758A (zh) * | 2016-11-25 | 2017-04-05 | 南京大学 | 一种沙粒显微图像的多目标自动鉴别方法 |
CN109284780A (zh) * | 2018-09-10 | 2019-01-29 | 中山大学 | 矿石矿物图像自动识别与分类方法 |
CN110580493A (zh) * | 2019-06-10 | 2019-12-17 | 长安大学 | 基于机器学习的集料形状分类方法 |
CN113435457A (zh) * | 2021-02-08 | 2021-09-24 | 中国石油化工股份有限公司 | 基于图像的碎屑岩成分鉴定方法、装置、终端及介质 |
CN114858801A (zh) * | 2022-05-25 | 2022-08-05 | 中国科学院西北生态环境资源研究院 | 一种基于图像光谱原理的炭屑自动统计方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567742A (zh) * | 2010-12-15 | 2012-07-11 | 中国科学院电子学研究所 | 一种基于自适应核函数选择的支持向量机自动分类方法 |
CN103207999A (zh) * | 2012-11-07 | 2013-07-17 | 中国矿业大学(北京) | 一种基于煤岩图像特征抽取以及分类识别的煤岩分界方法和系统 |
US20140348420A1 (en) * | 2013-05-24 | 2014-11-27 | Tata Consultancy Services Limited | Method and system for automatic selection of one or more image processing algorithm |
-
2015
- 2015-09-28 CN CN201510628405.4A patent/CN105354600B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567742A (zh) * | 2010-12-15 | 2012-07-11 | 中国科学院电子学研究所 | 一种基于自适应核函数选择的支持向量机自动分类方法 |
CN103207999A (zh) * | 2012-11-07 | 2013-07-17 | 中国矿业大学(北京) | 一种基于煤岩图像特征抽取以及分类识别的煤岩分界方法和系统 |
US20140348420A1 (en) * | 2013-05-24 | 2014-11-27 | Tata Consultancy Services Limited | Method and system for automatic selection of one or more image processing algorithm |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485223A (zh) * | 2016-10-12 | 2017-03-08 | 南京大学 | 一种砂岩显微薄片中岩石颗粒的自动识别方法 |
CN106485223B (zh) * | 2016-10-12 | 2019-07-12 | 南京大学 | 一种砂岩显微薄片中岩石颗粒的自动识别方法 |
CN106557758A (zh) * | 2016-11-25 | 2017-04-05 | 南京大学 | 一种沙粒显微图像的多目标自动鉴别方法 |
CN106557758B (zh) * | 2016-11-25 | 2019-04-19 | 南京大学 | 一种沙粒显微图像的多目标自动鉴别方法 |
CN109284780A (zh) * | 2018-09-10 | 2019-01-29 | 中山大学 | 矿石矿物图像自动识别与分类方法 |
CN110580493A (zh) * | 2019-06-10 | 2019-12-17 | 长安大学 | 基于机器学习的集料形状分类方法 |
CN113435457A (zh) * | 2021-02-08 | 2021-09-24 | 中国石油化工股份有限公司 | 基于图像的碎屑岩成分鉴定方法、装置、终端及介质 |
WO2022166232A1 (zh) * | 2021-02-08 | 2022-08-11 | 中国石油化工股份有限公司 | 岩石鉴定方法、系统、装置、终端及可读存储介质 |
CN114858801A (zh) * | 2022-05-25 | 2022-08-05 | 中国科学院西北生态环境资源研究院 | 一种基于图像光谱原理的炭屑自动统计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105354600B (zh) | 2018-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105354600A (zh) | 一种砂岩显微薄片的自动分类方法 | |
Chen et al. | Deep learning-based method for SEM image segmentation in mineral characterization, an example from Duvernay Shale samples in Western Canada Sedimentary Basin | |
CN109800736A (zh) | 一种基于遥感影像和深度学习的道路提取方法 | |
CN103020122B (zh) | 一种基于半监督聚类的迁移学习方法 | |
CN101604322B (zh) | 一种决策级文本自动分类融合方法 | |
CN109102014A (zh) | 基于深度卷积神经网络的类别不平衡的图像分类方法 | |
CN104102929A (zh) | 基于深度学习的高光谱遥感数据分类方法 | |
CN109165682A (zh) | 一种融合深度特征和显著性特征的遥感图像场景分类方法 | |
CN109523566A (zh) | 一种砂岩薄片显微图像的自动分割方法 | |
CN106557758B (zh) | 一种沙粒显微图像的多目标自动鉴别方法 | |
CN102855494A (zh) | 一种卫星遥感影像的水体提取方法及装置 | |
CN105046259B (zh) | 基于多特征融合的日冕物质抛射检测方法 | |
CN101876987A (zh) | 一种面向类间交叠的两类文本分类方法 | |
CN113256649B (zh) | 一种基于深度学习的遥感图像选站选线语义分割方法 | |
CN109902202A (zh) | 一种视频分类方法及装置 | |
CN113344050A (zh) | 一种基于深度学习的岩性智能化识别方法及系统 | |
CN108491864A (zh) | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 | |
CN105469111A (zh) | 基于改进的mfa和迁移学习的小样本集的物体分类方法 | |
CN109740656A (zh) | 一种基于卷积神经网络的矿石分选方法 | |
CN107767416A (zh) | 一种低分辨率图像中行人朝向的识别方法 | |
CN105913090A (zh) | 基于sdae-svm的sar图像目标分类方法 | |
CN104517120A (zh) | 基于多路分层正交匹配的遥感图像场景分类方法 | |
CN107480723A (zh) | 基于局部二进制阈值学习网络的纹理识别方法 | |
Niroumand Jadidi et al. | A novel approach to super resolution mapping of multispectral imagery based on pixel swapping technique | |
CN101655911A (zh) | 基于免疫抗体网络的模式识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Li Na Inventor after: Gu Qing Inventor after: Hao Huizhen Inventor after: Hu Xiumian Inventor after: Chen Daoxu Inventor before: Wang Jianxiang Inventor before: Gu Qing Inventor before: Yu Lixia Inventor before: Chen Daoxu |
|
COR | Change of bibliographic data | ||
GR01 | Patent grant | ||
GR01 | Patent grant |