CN109522830A - 一种面向海底底质分类的声纳图像特征选择的方法 - Google Patents

一种面向海底底质分类的声纳图像特征选择的方法 Download PDF

Info

Publication number
CN109522830A
CN109522830A CN201811310175.7A CN201811310175A CN109522830A CN 109522830 A CN109522830 A CN 109522830A CN 201811310175 A CN201811310175 A CN 201811310175A CN 109522830 A CN109522830 A CN 109522830A
Authority
CN
China
Prior art keywords
feature
redundancy
sonar image
dimensions
sediment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811310175.7A
Other languages
English (en)
Inventor
赵玉新
张响云
高峰
刘厂
董静
赵廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201811310175.7A priority Critical patent/CN109522830A/zh
Publication of CN109522830A publication Critical patent/CN109522830A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明属于海底底质声学图像特征选择领域,具体涉及一种面向海底底质分类的声纳图像特征选择的方法。包括二维特征间去冗余,多维特征间去冗余,基于最大相关最小冗余算法特征选择,BP神经网络分类验证四个关键步骤。本发明着手于基于海底底质声纳图像提取的多维特征,利用相关系数法除去特征间的冗余度,再利用特征之间最小冗余、特征与类之间最大相关的思路对特征进行选择。发明将相关系数去冗余的方法与最大相关最小冗余的算法相结合,取长补短,趋利避害。在特征选择过程中,既选出了能够代表类别信息的特征,又降低了计算量,节省了时间。

Description

一种面向海底底质分类的声纳图像特征选择的方法
技术领域
本发明属于海底底质声学图像领域,具体涉及一种面向海底底质分类的声纳图像特征选择的方法。
背景技术
随着物理声学的不断发展,利用声学对海底底质调查的方法逐渐代替了早些年应用的效率低、费用高且不适合大面积应用等弊端的可视化法和机械采样法。在声学方法中,利用声波反射和折射可携带信息的特性对海底底质进行预测和判别,具有效率高、费用低且适合大面积海域调查的优点,从而成为当前海底底质研究的热点方向之一。
由于在对声学反馈的信息进行特性提取时,获得的信息是多维的,因此会带来一定的冗余度。这就为后续的计算带来了困难,并干扰了分类器的功能,影响分类结果。所以,多维数据的评估有必要应用合适的特征选择方法,删掉原始特征组中的冗余量,从而得到一组最大相关且最小冗余的特征组,以此提高海底底质分类效果的准确度。
特征选择这一概念最初是为解决统计学中大规模数据计算而被提出的。众多方法中过滤式特征选择方法是特征选择过程与后续学习过程相分离的一种方法。具有效率高、结构简单、应用范围广等可取之处。在张风珍的《目标回声分类特征的冗余性评价》一文中提到了利用相关系数去冗余的方法,但其仅考虑了特征之间的冗余性,并没有考虑到特征与类之间的相关性。Peng H等人提出了一种不单顾及到各个特征维与类之间的相关性,同时也顾及到特征维彼此间冗余特性的最大相关最小冗余方法——mRMR。该方法依赖信息熵或互信息等对特征维之间、特征与类之间的关系进行度量,利用分类器等方式对度量后的特征维进行快速合理的选择。以此便可得到不仅和类相关性最强,而且特征维之间冗余性最低的特征子集。但在高维空间中,估计多维概率密度是一个难点,另一个缺点是计算速度非常慢。
发明内容
本发明的目的在于提供一种面向海底底质分类的声纳图像特征选择的方法,解决上述问题,且兼顾特征与类的最大相关最小冗余和快速性。
为实现上述目的,本发明采用如下技术方案:
步骤1:获得基于海底底质声纳图像提取的多维特征,利用相关系数法对二维特征冗余性进行理论分析,去除数据中二维特征间的冗余量;
步骤2:利用相关系数法对多维特征冗余性进行理论分析,去除数据中多维特征间的冗余量;
步骤3:利用最大相关最小冗余方法对步骤2中降维后的数据进行特征选择;
步骤4:利用BP神经网络对步骤3中筛选的特征选择结果进行分类验证,从分类结果分析筛选的特征是否满足要求;
步骤5:若满足要求则用特征选择结果代替整个数据集,若不满足要求则返回步骤3重新进行特征选择。
步骤1中所述的相关系数法为用线性相关系数r度量两个特征X,Y之间的冗余性,相关系数r构成的线性相关系数矩阵为:
其中,rXY代表特征维X与特征维Y的相关系数值,计算公式为:
其中X和Y为两个特征维,为对应X和Y两个特征维的平均值;n为样本数据的个数;SX和SY为对应X和Y两个特征维的标准差,计算公式为:
步骤1中所述的多维特征值数据中不同特征维取值的量纲需要统一。
步骤2中所述的多维特征间的冗余量通过求取协方差矩阵特征值的方法得到:
求取n维特征F={F1,F2,F3,…,Fn}的协方差矩阵为:
其中,σij为特征维Fi和Fj的协方差。
步骤3中所述的最大相关最小冗余方法为在由m个特征维构成的海底底质数据集中,选取n个特征维构成一个候选子集其中n≤m,这样的候选子集Sn共有个,且
在这个候选子集中,仅依据最大相关条件挑取最佳特征子集,应满足以下关系式:
其中,I(vi,p)代表了子集Sn中第i个特征维和类p间的互信息熵;
加入基于最小冗余的限制条件,使集合Sn所涵盖的n个特征维彼此间的互信息熵最低,则应满足如下公式:
其中,I(vivj)代表集合Sn内特征维vi和特征维vj彼此间的互信息熵。
本发明的有益效果在于:
(1)将相关系数去冗余的方法与最大相关最小冗余的方法相结合,取长补短,趋利避害;
(2)在特征选择过程中,既选出了能够代表类别信息的特征,又降低了计算量,节省了时间。
附图说明
图1为一种面向海底底质分类的声纳图像特征选择的方法流程图;
图2为一种面向海底底质分类的声纳图像特征选择的方法流程示意图。
具体实施方式
下面结合附图对本发明的具体实施步骤作进一步地详细说明。
本发明是针对海底底质声学图像的多维特征空间进行特征选择算法的研究。能够把数据中的噪声及冗余信息剔除,减少建立分类模型的时间,提高分类器的准确性。本发明提出用相关系数法除去特征中相关性强的特征实现降维,为mRMR算法减小计算量。对降维后的特征利用mRMR算法进行特征选择。
本发明是一种适用于海底底质分类的水声图像特征选择方法,采用特征去冗余与特征选择相融合的方法,包括二维特征去冗余、多维特征去冗余、基于最大相关最小冗余算法特征选择、BP神经网络分类等几个关键步骤。
如图1所示,适用于海底底质分类的声纳图像特征选择方法,具体步骤如下:
步骤1:数据源是基于海底底质声纳图像提取的多维特征,此类数据是通过对图片进行一定的数学运算得到的如能量、对比度、自相关等各种特征量,特征量之间难免会存在冗余性,通过相关系数法对二维特征冗余性进行理论分析,去除原始数据中二维特征间的冗余量实现降维。
步骤2:利用相关系数法对数据多维特征冗余性进行理论分析,去除二维特征冗余的多维特征间的冗余量。大大降低数据中的冗余信息,进一步的实现降维,使得数据中冗余信息降到最低。
步骤3:利用最大相关最小冗余算法(mRMR)对上一步降维后的数据进行特征选择。筛选出最能代表数据集的几个特征。
步骤4:利用BP神经网络对上一步筛选的特征选择结果进行分类验证。从分类结果来分析筛选的特征能否满足要求,代替整个数据集。
步骤5:若步骤4得到的分类结果并不能满足实验要求,则需要从新进行特征选择。直到满足要求为止。
步骤1中的相关系数法是用线性相关系数r来度量两个特征X,Y之间冗余性。线性相关公式为:
其中:X和Y为2个特征维;为对应X,Y两个特征集合的平均值;n为样本数据的个数;SX和SY为其标准差:
rXY绝对值的值域是[0,1],其绝对值越接近于1,那就说明特征维X与特征维Y的相关程度越高,同时也就表明了两者间的冗余性越强。当待处理的数据是特征集合时,可以通过求取其相关系数矩阵来分析样本数据中两两特征维之间的冗余程度,其表达式如下所示:
式中:rij代表了特征维i与特征维j的相关系数值。
特别注意的是,当数据中存在不同特征维取值的量纲相差很大时,应统一量纲后再进行分析。否则,在求取相关度时数值大的特征数据会干扰到其他特征,这样会使最终特征间冗余性评价结果受到影响。
步骤2中多维去冗余的具体如下:
求取n维特征F={F1,F2,F3,…,Fn}的协方差矩阵为:
其中,σij为特征维Fi和Fj的协方差。如果协方差矩阵∑含有接近于0的特征值,则存在:
∑γn=(F-μ)(F-μ)Tγn=λnγn≈0
其中,μ为特征的均值向量;λn为协方差矩阵∑的最小特征值;γn为关于λn的特征向量。由式上式可得:
(F-μ)Tγn≈0
由于协方差矩阵∑的特征向量γn=(γn1,γn2,γn3,…,γnn)T是非零向量,所以
之间是线性相关的关系。这也就表明了,原始特征集F之间包含了多维特征冗余的情况。
与二维特征间由线性相关系数来衡量的冗余程度相比,求取协方差矩阵特征值的方法能够进一步揭示多维特征间的冗余特性。
步骤3中,所述的最大相关最小冗余的方法是一种基于互信息的方法,具体为:
在由m个特征维构成的海底底质数据集中,选取n(n≤m)个特征维构成一个候选子集这样的候选子集Sn共有个,其显然在这个候选子集中,若仅依据最大相关条件挑取最佳特征子集,应满足以下关系式:
其中,I(vi,p)代表了子集Sn中第i个特征维和类p间的互信息熵。
再加入基于最小冗余的限制条件。要想使集合Sn所涵盖的n个特征维彼此间的互信息熵最低。其应满足如下公式:
其中,I(vivj)代表集合Sn内特征维vi和特征维vj彼此间的互信息熵。
本发明公开了一种面向海底底质分类的声纳图像特征选择的算法,主要步骤包括二维特征间去冗余,多维特征间去冗余,基于最大相关最小冗余算法特征选择,BP神经网络分类验证四个关键步骤。本发明着手于基于海底底质声纳图像提取的多维特征,利用相关系数法除去特征间的冗余度,再利用特征之间最小冗余、特征与类之间最大相关的思路对特征进行选择。本发明将相关系数去冗余的方法与最大相关最小冗余的算法相结合,取长补短,趋利避害。在特征选择过程中,既选出了能够代表类别信息的特征,又降低了计算量,节省了时间。

Claims (5)

1.一种面向海底底质分类的声纳图像特征选择的方法,其特征在于,包括:
(1)获得基于海底底质声纳图像提取的多维特征,利用相关系数法对二维特征冗余性进行理论分析,去除数据中二维特征间的冗余量;
(2)利用相关系数法对多维特征冗余性进行理论分析,去除数据中多维特征间的冗余量;
(3)利用最大相关最小冗余方法对步骤(2)中降维后的数据进行特征选择;
(4)利用BP神经网络对步骤(3)中筛选的特征选择结果进行分类验证,从分类结果分析筛选的特征是否满足要求;
(5)若满足要求则用特征选择结果代替整个数据集,若不满足要求则返回步骤(3)重新进行特征选择。
2.根据权利要求1所述的一种面向海底底质分类的声纳图像特征选择的方法,其特征在于:所述的步骤(1)中相关系数法为用线性相关系数r度量两个特征X,Y之间的冗余性,相关系数r构成的线性相关系数矩阵为:
其中,rXY代表特征维X与特征维Y的相关系数值,计算公式为:
其中X和Y为两个特征维,为对应X和Y两个特征维的平均值;n为样本数据的个数;SX和SY为对应X和Y两个特征维的标准差,计算公式为:
3.根据权利要求1所述的一种面向海底底质分类的声纳图像特征选择的方法,其特征在于:所述的步骤(1)中多维特征值数据的不同特征维取值的量纲需要统一。
4.根据权利要求1所述的一种面向海底底质分类的声纳图像特征选择的方法,其特征在于:所述的步骤(2)中多维特征间的冗余量通过求取协方差矩阵特征值的方法得到,求取n维特征F={F1,F2,F3,…,Fn}的协方差矩阵为:
其中,σij为特征维Fi和Fj的协方差。
5.根据权利要求1所述的一种面向海底底质分类的声纳图像特征选择的方法,其特征在于:所述的步骤(3)中最大相关最小冗余方法为在由m个特征维构成的海底底质数据集中,选取n个特征维构成一个候选子集其中n≤m,这样的候选子集Sn共有个,且在这个候选子集中,仅依据最大相关条件挑取最佳特征子集,应满足以下关系式:
其中,I(vi,p)代表了子集Sn中第i个特征维和类p间的互信息熵;加入基于最小冗余的限制条件,使集合Sn所涵盖的n个特征维彼此间的互信息熵最低,则应满足如下公式:
其中,I(vivj)代表集合Sn内特征维vi和特征维vj彼此间的互信息熵。
CN201811310175.7A 2018-11-06 2018-11-06 一种面向海底底质分类的声纳图像特征选择的方法 Pending CN109522830A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811310175.7A CN109522830A (zh) 2018-11-06 2018-11-06 一种面向海底底质分类的声纳图像特征选择的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811310175.7A CN109522830A (zh) 2018-11-06 2018-11-06 一种面向海底底质分类的声纳图像特征选择的方法

Publications (1)

Publication Number Publication Date
CN109522830A true CN109522830A (zh) 2019-03-26

Family

ID=65772961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811310175.7A Pending CN109522830A (zh) 2018-11-06 2018-11-06 一种面向海底底质分类的声纳图像特征选择的方法

Country Status (1)

Country Link
CN (1) CN109522830A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110716234A (zh) * 2019-11-07 2020-01-21 中国科学院声学研究所东海研究站 一种用于海底底质识别的声学数据获取方法
CN110710984A (zh) * 2019-10-18 2020-01-21 福州大学 基于表面肌电信号的递归小脑模型的足踝力矩预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050242A (zh) * 2014-05-27 2014-09-17 哈尔滨理工大学 基于最大信息系数的特征选择、分类方法及其装置
CN108509996A (zh) * 2018-04-03 2018-09-07 电子科技大学 基于Filter和Wrapper选择算法的特征选择方法
CN108564009A (zh) * 2018-03-28 2018-09-21 天津大学 一种基于互信息量的改进特征评价方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050242A (zh) * 2014-05-27 2014-09-17 哈尔滨理工大学 基于最大信息系数的特征选择、分类方法及其装置
CN108564009A (zh) * 2018-03-28 2018-09-21 天津大学 一种基于互信息量的改进特征评价方法
CN108509996A (zh) * 2018-04-03 2018-09-07 电子科技大学 基于Filter和Wrapper选择算法的特征选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘依恋: "模式分类中特征选择算法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 *
张风珍等: "目标回声分类特征的冗余性评价", 《舰船科学技术》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110710984A (zh) * 2019-10-18 2020-01-21 福州大学 基于表面肌电信号的递归小脑模型的足踝力矩预测方法
CN110710984B (zh) * 2019-10-18 2021-11-02 福州大学 基于表面肌电信号的递归小脑模型的足踝力矩预测方法
CN110716234A (zh) * 2019-11-07 2020-01-21 中国科学院声学研究所东海研究站 一种用于海底底质识别的声学数据获取方法
CN110716234B (zh) * 2019-11-07 2021-10-19 中国科学院声学研究所东海研究站 一种用于海底底质识别的声学数据获取方法

Similar Documents

Publication Publication Date Title
Liu et al. Underwater target recognition using convolutional recurrent neural networks with 3-D Mel-spectrogram and data augmentation
CN110245608B (zh) 一种基于半张量积神经网络的水下目标识别方法
CN105809198B (zh) 基于深度置信网络的sar图像目标识别方法
CN112184752A (zh) 一种基于金字塔卷积的视频目标跟踪方法
CN105023573B (zh) 使用听觉注意力线索的语音音节/元音/音素边界检测
Liu et al. Remote sensing image change detection based on information transmission and attention mechanism
CN108765506A (zh) 基于逐层网络二值化的压缩方法
CN110826428A (zh) 一种高速的sar图像中船只检测方法
Liang et al. Comparison detector for cervical cell/clumps detection in the limited data scenario
CN110648311B (zh) 一种基于多任务学习的痤疮图像病灶分割与计数网络模型
Qian et al. FESSD: SSD target detection based on feature fusion and feature enhancement
CN111145145B (zh) 一种基于MobileNets的图像表面缺陷检测方法
CN114913379B (zh) 基于多任务动态对比学习的遥感图像小样本场景分类方法
CN109522830A (zh) 一种面向海底底质分类的声纳图像特征选择的方法
Hu et al. Supervised multi-scale attention-guided ship detection in optical remote sensing images
CN110991554A (zh) 一种基于改进pca的深度网络图像分类方法
López-Cifuentes et al. Attention-based knowledge distillation in scene recognition: the impact of a dct-driven loss
CN118051831A (zh) 基于CNN-Transformer合作网络模型的水声目标识别方法
Wang et al. A hierarchical birdsong feature extraction architecture combining static and dynamic modeling
Zhang et al. MSLEFC: A low-frequency focused underwater acoustic signal classification and analysis system
Liu et al. A multi-scale feature pyramid SAR ship detection network with robust background interference
CN113673465A (zh) 图像检测方法、装置、设备及可读存储介质
Zhang et al. CAM R-CNN: End-to-end object detection with class activation maps
CN108304866A (zh) 一种多视图特征判别方法
CN109934248B (zh) 一种针对迁移学习的多模型随机生成与动态自适应组合方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190326