发明内容
本发明的目的就是为了解决上述问题,提出了一种探地雷达数据可视化方法,该方法基于多尺度局部特征和动态时间规整,从而客观的挖掘更多有效特征信息,解决了GPR数据解译过程中过于依赖人工因素的问题。
为了解决上述问题,本发明采用如下技术方案:
一种探地雷达数据可视化方法,包括以下步骤:
(1)选定GPR数据集,分别提取GPR数据集不同尺度的无监督局部特征,得到GPR数据的局部特征集U={U(1),U(2),…,U(m)};
(2)设定待匹配子序列长度范围[minlen,maxlen],利用动态时间归整方法将待测的GPR数据集D={T(1),T(2),…,T(n)}与步骤(1)中所得局部特征集U进行模式匹配分类,U中的m即为此处分类数目;
(3)用可视化方法中的颜色映射方法将步骤(2)中进行模式匹配的结果进行展示,得到GPR数据的直观图像表示。
所述步骤(1)中提取GPR数据的不同尺度的无监督局部特征的方法为:
步骤S110:选取待测GPR数据集中某一序列T(ds)=(t1,t2,…tlen),其中1≤ds≤n,初始化无监督局部特征数据集U=Φ;
步骤S120:设定滑动窗口范围ql,移动步长l,从序列T(ds)中生成多个尺度的候选无监督局部特征集C;
步骤S130:计算候选集C中每一个候选序列的质量度量gap,并对其排序;
步骤S140:取质量度量gap最大的候选序列,更新到无监督局部特征数据集U中作为U(i);
步骤S150:计算U(i)与GPR数据集中各序列的距离,设定阈值θ,移除距离小于阈值θ的序列,判断DISA是否稳定,若稳定,则输出特征集U;否则取距离最大的序列,返回步骤S110。
所述步骤S150中,
判断DISA稳定的条件具体为:
|DISA|=1;
即:当小于分割点dt的距离的个数等于1达到稳定。
计算候选集C中每一个候选序列的质量度量gap的方法为:
S131:输入候选序列C(c)和数据集D={T(1),T(2),…,T(n)},初始化maxGap=0;
S132:计算候选序列C(c)与数据集D中各序列的距离,并将其排序,得到候选序列C(c)与数据集D中各序列距离的距离向量DIS={dis1,dis2,…disn};
S133:根据距离向量可得n-1个分割点dt,对每一个分割点dt分别计算分割点dt两端的距离个数的比值R;
S134:判断R是否满足设定条件,若是则计算gap,否则计算下一分割点的R;
S135:判断计算的gap是否大于maxGap,是则更新maxGap,否则计算下一分割点gap。
所述步骤S133中,计算R的方法为:
其中,DISA表示距离向量DIS中小于分割点dt的各距离集合,DISB表示距离向量DIS中大于分割点dt的各距离集合,〡DISA〡表示小于分割点dt的距离个数,〡DISB〡表示大于分割点dt的距离个数。
所述步骤S134中R的设定条件为:
R∈(0.2,5)。
所述步骤S134中,计算gap的方法具体为:
gap=μB-σB-(μA+σB)
其中,μB表示大于分割点dt的所有距离的平均值,σB表示大于分割点dt的所有距离的方差,μA表示小于分割点dt的所有距离的平均值,σA表示小于分割点dt的所有距离的方差。
所述步骤S132中,
计算候选序列C(c)与数据集D中各序列距离的距离向量的方法为:
S1321:输入一个候选序列C=(c1,c2,…cclen)和数据集D={T(1),T(2),…,T(n)};
S1322:初始化距离向量DIS=Φ;
S1323:利用滑动窗口ql=clen,clen为当前候选序列C=(c1,c2,…cclen)的长度,依次取出T(ds)的所有子序列Z={Z1,Z2,…Zv},Zi=(z1,z2,…,zclen);
其中:
T(ds)=(t1,t2,…tlen),len为数据集T(ds)=(t1,t2,…tlen)的长度;
S1324:计算候选序列C(c)与子序列集Z中各子序列之间的距离dis,取最小值为候选序列C(c)与数据序列T(ds)的距离disds,更新到DIS中;
S1325:判断ds是否为n,若是,则对DIS排序得DIS={dis1,dis2,…disn},否则,转向步骤S1323。
所述步骤(2)的具体方法为:
步骤S201:设定待匹配子序列长度范围[minlen,maxlen],输入待测的GPR数据集D={T(1),T(2),…,T(n)}与局部特征集U={U(1),U(2),…,U(m)};
步骤S202:对于T(ds),分别初始化起始点st=1、长度值Mlen=minlen以及距离向量sdist=Φ;
步骤S203:初始化i=1;
步骤S204:计算[minlen,maxlen]范围内,与局部特征U(i)距离di最小的子序列M(st,Mlen),更新到距离向量sdist;
步骤S205:判断i是否为m,若是,则排序距离向量sdist,否则i=i+1,转向步骤S204;
步骤S206:取子序列M(st,Mlen)与局部特征集U中各特征的距离的距离向量中最小的i值,作为M(st,Mlen)的类别序号;
步骤S207:判断st+Mlen-1是否为len,若是,则下一步;否则更新起始点st=st+Mlen,并转向步骤S204;len为T(ds)的长度;
步骤S208:判断ds是否为n+1,若是,则下一步;否则返回步骤S202;
步骤S209:输出类别矩阵。
所述步骤S204中,di距离计算公式为:
di=DTW(M(st,Mlen),U(i));
其中,st为待匹配序列的起始点,Mlen为[minlen,maxlen]范围内某一长度,U(i)为局部特征,M(st,Mlen)为与局部特征U(i)距离di最小的子序列。
本发明的有益效果:
本发明对于GPR数据应用性强,并且能够更好的提取有效GPR数据特征,更为客观的呈现了GPR数据所蕴含的信息,用可视化方法直观的体现了探测结果。
通过对数据集的多尺度局部特征的提取,解决了未知探测区域地下介质类目问题,区分出了不同的地下介质,克服了传统GPR数据介意过程中特征提取方法所带来的多解性的缺点。
通过采用DTW距离计算能够对不等长序列进行相似的度量;并且DTW对于序列的突变或者异常点并不敏感,这对于GPR数据中异常的噪点可以起到忽略的作用。
具体实施方式
下文将结合具体实施例详细描述本发明。应当注意的是,下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的,它们可以被相互组合从而达到更好的技术效果。
如图1所示,本发明提供的一种基于多尺度局部特征和动态时间规整的探地雷达数据可视化方法包括如下步骤:
步骤S100:对GPR数据提取多尺度的局部特征;
步骤S200:利用DTW距离对S100所述特征模型与GPR数据进行模式匹配;
步骤S300:对S200所述模式匹配结果运用可视化方法得到GPR数据的直观图像表示。
上述步骤S100:对GPR数据提取多尺度的局部特征,具体地包括如下步骤:
步骤S110:输入GPR数据集中某一序列T(ds),初始化无监督局部特征数据集U=Φ。
步骤S120:设定滑动窗口范围ql,移动步长l,从T(ds)中生成多个尺度的候选无监督局部特征集C。
步骤S130:计算候选集C中每一个候选序列的质量度量gap,并对其排序。其中质量度量gap计算公式如下:
gap=μB-σB-(μA+σB)
步骤S140:取最大gap的候选序列,更新到无监督局部特征数据集U中作为U(i)。
这样提出去的是某一个尺度的无监督局部特征的提取后,我们便提取到某一道GPR数据序列T(ds)中的某一位置的一个无监督局部特征,表明此道GPR数据序列中的此位置上的介质特征。然而GPR数据中可能包含更多的介质信息特征,因而我们对GPR数据中含有此类介质特征相似的数据序列去除处理后,对数据集中剩余数据序列进行下一局部特征的查找,其尺度取决于此特征的gap度量大小,因此最后我们会提取到多个尺度的局部特征。
步骤S150:计算U(i)与GPR数据集D中各序列距离,移除距离小于阈值θ的序列,判断DISA是否稳定,若稳定,则输出特征集U,否则取距离最大的序列,重复步骤S110。
该稳定条件为:
|DISA|=1
即:当小于分割点dt的距离的个数等于1达到稳定。
上述步骤S130:计算候选集C中每一个候选序列的质量度量gap,具体地包括如下步骤:
S131:输入候选序列C(c)和数据集D={T(1),T(2),…,T(n)},初始化maxGap=0;
S132:计算候选序列C(c)与数据集D中各序列的距离,并将其排序,可得C(c)与D中各序列距离的距离向量DIS={dis1,dis2,…disn};
S133:根据距离向量可得n-1个分割点dt,对每一个分割点dt计算分割点dt两端各距离个数的比值R;
R计算公式为:
S134:判断R是否满足条件,若是则计算gap,否则下一分割点;
其中R需要满足的条件是:
R∈(0.2,5);
此条件用来控制分割点dt两边各距离数量的比例。
S135:判断是否大于maxGap,是则更新,否则计算下一分割点gap。
上述步骤S132:计算C(n)与D中各序列距离,具体地包括如下步骤:
S1321:输入一个候选序列C=(c1,c2,…cclen)和数据集D={T(1),T(2),…,T(n)};
S1322:初始化距离向量DIS=Φ;
S1323:利用滑动窗口ql=clen,clen为当前候选序列C的长度,依次取出T(ds)=(t1,t2,…tlen)的所有子序列;1≤ds≤n,len为数据集中T(ds)的长度;
S1324:计算候选序列C(c)与所有子序列距离dis,取最小值为C(c)与T(ds)的距离disds,更新到DIS中;
S1325:判断ds是否为n,若是,则对DIS排序得DIS={dis1,dis2,…disn},否则转向S1323。
GPR数据是通过分析GPR接收到的有效反射电磁波的特征来推断被测地下介质的空间分布状态。不同介质对于电磁波的具有不同的反射特性,表现在波形上就有不同的结果。经过多个尺度特征提取后,提取出GPR数据中蕴含的多个介质信息特征。传统的GPR数据处理方法多为去噪和抑制杂波,再加上较为依赖人工解译的主观判断,探测效果往往不尽人意。本文提出用DTW距离将提取出的局部特征与GPR数据进行模式匹配的方法,会得到更为客观的分析结果。
模式匹配是度量数据序列相似程度的方法,在数据序列分析处理中具有基础性地位。其思想在于输入未知模式与已提取的特征模式相比较,具有相同或相似匹配的模式即为该位置模式的所属类型。两序列距离越小,越相似。在这里使用DTW距离直接匹配的优势在于:一方面在于特征提取的过程中,每一个提取出的局部特征可能会有不同的尺度,此时就可以充分体现DTW对于不等长序列进行相似度量的优势;而另一方面在于DTW对于序列的突变或者异常点并不敏感,这对于GPR数据中异常的噪点可以起到忽略的作用。
上述步骤S200:上述利用DTW距离对S100所述特征模型与GPR数据进行模式匹配,具体的包括如下步骤:
步骤S201:设定待匹配子序列长度范围[minlen,maxlen],输入待测的GPR数据集D={T(1),T(2),…,T(n)}与局部特征集U={U(1),U(2),…,U(m)};
步骤S202:对于T(ds),分别初始化起始点st=1、长度值Mlen=minlen以及距离向量sdist=Φ;
步骤S203:初始化i=1;
步骤S204:计算[minlen,maxlen]范围内,与局部特征U(i)距离di最小的子序列M(st,Mlen),更新到距离向量sdist;
di距离计算公式为:
di=DTW(M(st,Mlen),U(i));
其中,st为待匹配序列的起始点,Mlen为[minlen,maxlen]范围内某一长度,U(i)为局部特征,M(st,Mlen)为与局部特征U(i)距离di最小的子序列。
步骤S205:判断i是否为m,若是,则排序距离向量sdist,否则i=i+1,转向步骤S204;
步骤S206:取子序列M(st,Mlen)与局部特征集U中各特征的距离的距离向量中最小的i值,作为M(st,Mlen)的类别序号;
步骤S207:判断st+Mlen-1是否为len,若是,则下一步;否则更新起始点st=st+Mlen,并转向步骤S204;len为T(ds)的长度;
步骤S208:判断ds是否为n+1,若是,则下一步;否则返回步骤S202;
步骤S209:输出类别矩阵。
上述步骤S300:对S200所述模式匹配结果运用可视化方法中颜色映射技术得到GPR数据的直观图像表示。
本文虽然已经给出了本发明的一些实施例,但是本领域的技术人员应当理解,在不脱离本发明精神的情况下,可以对本文的实施例进行改变。上述实施例只是示例性的,不应以本文的实施例作为本发明权利范围的限定。