CN107731235A

CN107731235A - 抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类方法及装置

Info

Publication number: CN107731235A
Application number: CN201710938504.1A
Authority: CN
Inventors: 蒋佳佳; 卜令冉; 段发阶; 王宪全; 孙中波; 李春月; 马世雄; 邓澈
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2017-09-30
Filing date: 2017-09-30
Publication date: 2018-02-23
Anticipated expiration: 2037-09-30
Also published as: CN107731235B

Abstract

本发明属于海洋应用声学领域，为提出一种完整的，能自动探测抹香鲸叫声脉冲和长鳍领航鲸叫声脉冲，并对叫声脉冲特征进行精确提取，最后通过分类器对两种叫声脉冲实现精确分类的方法和装置。本发明采用的技术方案是，抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类装置，由三个子系统构成：鲸叫声脉冲预处理子系统，鲸叫声脉冲特征提取子系统和鲸叫声脉冲特征分类子系统，其中，鲸叫声脉冲预处理子系统包括：水听器，声音存储介质，声音去噪模块和端点检测模块；鲸叫声脉冲特征提取子系统包括连续小波变换预处理模块，有效系数区域提取模块，频率特征提取模块和时间特征提取模块。本发明主要应用于声探测场合。

Description

抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类方法及装置

技术领域

本发明属于海洋应用声学领域，特别是一种抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类方法及装置。

背景技术

海洋动物声音的探测和分类在研究物种习性、保护生物资源和防止鲸鱼搁浅等领域有着重要的基础性作用。由于鲸叫声脉冲持续时间短，不同鲸叫声脉冲对人耳的作用效果十分相似，传统的人工方法很难准确地对鲸叫声脉冲进行探测和分类，且效率较低。抹香鲸和长鳍领航鲸分布广泛，数量庞大，两者的分布海域多有重合，且抹香鲸叫声多为叫声脉冲，因此将两者叫声脉冲进行自动精确区分具有重要意义。鲸叫声脉冲是典型的短时非平稳声音信号，目前已有的自动海洋动物声音的特征提取与分类的方法，多集中于鲸或海豚的长叫声(哨声Whistle、叫声Call等)的特征提取与分类，并不能很好地适应持续时间短的鲸叫声脉冲。

发明内容

为克服现有技术的不足，克服现有人工声音分类方法正确率和效率低下以及目前自动分类方法适用性较差的缺点，本发明旨在提出一种完整的，能自动探测抹香鲸叫声脉冲和长鳍领航鲸叫声脉冲，并对叫声脉冲特征进行精确提取，最后通过分类器对两种叫声脉冲实现精确分类的方法和装置。本发明采用的技术方案是，抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类装置，由三个子系统构成：鲸叫声脉冲预处理子系统，鲸叫声脉冲特征提取子系统和鲸叫声脉冲特征分类子系统，其中，鲸叫声脉冲预处理子系统包括：水听器，声音存储介质，声音去噪模块和端点检测模块；鲸叫声脉冲特征提取子系统包括连续小波变换预处理模块，有效系数区域提取模块，频率特征提取模块和时间特征提取模块；鲸叫声脉冲特征分类子系统包括特征向量拼合模块，分类器训练模块，分类器分类模块和分类结果显示模块；

水听器采集或者声音存储介质存储的含有鲸叫声脉冲的声音，首先经过声音去噪模块，得到去噪后的声音信号，经过端点检测模块，提取出含有鲸叫声脉冲的特征帧；进一步地，特征帧经过连续小波变换预处理模块，得到连续小波变换系数矩阵，经有效系数区域提取模块，系数矩阵所有系数取绝对值后，得到绝对值系数矩阵，绝对值矩阵首先经过有效系数提取模块，得到有效系数区域，经频率特征提取模块和时间特征提取模块基于有效系数区域的频率特征提取算法和时间特征提取算法，得到特征向量，进一步地，特征向量被送入先前已训练过的分类器分类模块后，分类器对特征向量进行分类，输出分类结果经分类结果显示模块显示。

鲸叫声脉冲特征提取子系统各模块可设置于DSP、FPGA或ARM硬件平台，鲸叫声脉冲特征分类子系统各模块可设置于DSP、FPGA或ARM硬件平台。

选择7阶Symlets小波函数作为连续小波变换的母小波。

经有效系数区域提取模块中，首先提取绝对值系数矩阵的有效系数区域，(1)在绝对值系数矩阵中，计算矩阵中每个尺度下的系数平均值，并标记为T_i,i＝1,2,…,n,其中n是尺度数量，(2)将矩阵中的每个系数与其对应尺度下的T_i进行比较，如果系数值大于T_i，则保留为有效系数，否则删除该系数；(3)所有有效系数组成了有效系数区域ECA(EffectiveCoefficientArea,)，ECA保留了表征鲸叫声脉冲特征的系数，并丢弃了无用系数；

频率特征提取模块和时间特征提取模块中，进一步地，基于ECA，将ECA中相同尺度i的有效系数相加求得各尺度有效系数之和S(i),i＝1,2,…n,其中n是尺度数量；

进一步地，尺度区间可以被等分成几个子区间I_j,j＝1,2,…m，其中m是子区间总数，S(i)在每个子区间中进一步相加得到各子区间有效系数之和E_j：

式中j＝1,2,…m,m是子区间总数，m<n；I_j是子区间范围，所有E_j构成了频率特征；

进一步地，鲸叫声脉冲持续时间也是对两种鲸叫声脉冲进行分类的重要特征，通过以下过程提取时间特征：(1)基于ECA，计算ECA中每个尺度i的有效系数数量，并将其标记为N_i,i＝1,2,…,n,其中n是尺度数量，(2)将N_i的最大值标记为N_max，(3)时间特征t_d通过下式计算：

式中f_s是声音信号的采样率。

进一步地，频率特征和时间特征构成特征向量。

分类模块中，使用反向传播神经网络BP(Back Propagation Network)作为鲸叫声脉冲特征分类器，首先设定分类器参数，包括网络层数、输入层、隐含层节点数、输出层神经元个数、传递函数、训练方法、神经网络的初始权值、误差容限、学习率、动量因子、最大迭代次数和第一代初始参数，进一步地，经过鲸叫声脉冲特征提取子系统得到的鲸叫声脉冲特征向量，选择若干特征向量作为训练数据，对神经网络进行训练。神经网络训练完成后，待分类信号被送入分类器，根据分类器的输出结果进行分类决策，最后输出最终分类结果。

抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类方法，步骤如下：

第一步：原始声音去噪过程和鲸叫声脉冲探测过程

水听器采集或者计算机存储介质存储的含有鲸叫声脉冲的声音首先需要经过采用小波去噪阈值去噪进行去噪处理，进一步地，使用通用值作为硬阈值，其中n是信号的长度，用该阈值函数对各层系数进行量化，最后用处理后的系数重构信号，得到去噪信号；

进一步地，去噪信号通过双门限端点检测算法检测鲸叫声脉冲的起始点与结束点，该算法中利用短时能量和短时平均过零率进行端点检测，每个鲸叫声脉冲检测估计中心位置t由下式计算：

其中t_on和t_off是通过双门限端点检测算法检测到的鲸叫声脉冲的起始点与结束点；

进一步地，以中心位置t为中心，提取合适点数的信号，作为鲸叫声脉冲特征帧；

第二步：叫声脉冲信号连续小波分解与有效系数提取过程

对鲸叫声脉冲特征帧，首先进行连续小波变换，选择7阶Symlets小波函数作为连续小波变换的母小波，分解层数设定为400，连续小波变换分解后，得到鲸叫声脉冲特征帧的小波系数矩阵，进一步地，小波系数矩阵所有系数取绝对值后，得到绝对值系数矩阵；

提取绝对值系数矩阵的有效系数区域ECA：(1)在绝对值系数矩阵中，计算矩阵中每个尺度下的系数平均值20，并标记为T_i,i＝1,2,…,n,其中n是尺度数量；(2)将矩阵中的每个系数与其对应尺度下的T_i进行比较，如果系数值大于T_i，则保留为有效系数，否则删除该系数；(3)所有有效系数组成了有效系数区域ECA，ECA保留了表征鲸叫声脉冲特征的系数，并丢弃了无用系数；

第三步：频率特征和时间特征提取过程。

进一步地，基于ECA，将ECA中相同尺度i的有效系数相加求得S(i),i＝1,2,…n,其中n是尺度数量；

进一步地，尺度区间可以被等分成几个子区间I_j,j＝1,2,…m，其中m是子区间总数，S(i)在每个子区间中进一步相加得到E_j：

式中j＝1,2,…m,m是子区间总数，m<n；I_j是子区间范围，设定m＝10，则得到10个频率特征值，所有E_j构成了频率特征；

进一步地，鲸叫声脉冲持续时间也是对两种鲸叫声脉冲进行分类的一个重要特征，通过以下过程提取时间特征：(1)基于ECA，计算ECA中每个尺度i的有效系数数量，并将其标记为N_i,i＝1,2,…,n,其中n是尺度数量；(2)将N_i的最大值标记为N_max。(3)时间特征t_d通过下式计算：

式中f_s是声音信号的采样率。

进一步地，频率特征和时间特征构成特征向量；

第四步：分类器训练、测试和分类过程

进一步地，使用BP神经网络作为鲸叫声脉冲特征分类器，首先合理设定分类器参数，设定分类器的初始结构，设定网络层数、输入层、隐含层节点数、输出层神经元个数、传递函数、训练方法和神经网络的初始权值参数；

进一步地，经过鲸叫声脉冲特征提取子系统得到的鲸叫声脉冲特征向量，随机选择若干特征向量作为训练数据，设定误差容限、学习率、动量因子、最大迭代次数和第一代初始参数，对神经网络进行训练。神经网络训练完成后，将分类特征向量送入分类器，根据分类器的输出结果进行分类决策，最后输出分类结果。

本发明的特点及有益效果是：

本发明针对鲸叫声脉冲短时非平稳的特性，有效地克服了现有鲸长叫声特征提取方法的缺点，能很好地适应鲸叫声脉冲短时非平稳特性；能够准确地提取鲸叫声脉冲时域和频域的特征；该特征即使在训练数据量较少的情况下，通过少量的数据训练，也能实现很高的分类正确率；该特征即使在减少特征数量的情况下，也能很好地表征鲸叫声脉冲时域和频域的特征，实现很高的分类正确率。

附图说明：

图1示出本鲸叫声脉冲特征提取和精确分类方法的主要功能框图。

图1中：1为水听器(声音采集)；2为声音存储介质(声音存储)；3为声音去噪模块；4为端点检测模块；5为连续小波变换预处理模块；6为有效系数区域提取模块；7为频率特征提取模块；8为时间特征提取模块；9为特征向量拼合模块；10为分类器训练模块；11为分类器分类模块；12为分类结果显示模块；13为鲸叫声脉冲预处理子系统；14为鲸叫声脉冲特征提取子系统；15为鲸叫声脉冲特征分类子系统。

图2示出本发明中鲸叫声脉冲特征提取模型示意图。

图2中：16为鲸叫声脉冲特征帧；17为连续小波变换预处理模块；18为连续小波变换系数矩阵；19为阈值计算模块；20为有效系数阈值；21为阈值比较模块；22为有效系数；23为有效系数区域组成模块；24为有效系数区域；25为有效系数求和模块；26为相同尺度系数和S(i)；27为子区间求和模块；28为子区间系数和E_j；29为频率特征生成模块；30为有效系数数量计算模块；31为各尺度下有效系数数量N_i；32为求取N_i最大值模块；33为N_i最大值N_max；34为时间特征生成模块；35为时间特征和频率特征；36为特征向量。

图3示出本发明中鲸叫声脉冲特征分类模型示意图。

图3中：37为分类器结构要求；38为分类器参数确定过程；39为分类器结构参数；40为用于训练的特征向量；41为分类器训练过程；42为训练过程对分类器参数的优化；43为BP神经网络分类器；44为待分类特征向量；45为分类器输出结果；46为分类决策模块；47为最终分类结果。

具体实施方式

本发明的目的是克服现有人工声音分类方法正确率和效率低下以及目前自动分类方法适用性较差的缺点，提供一种能实现抹香鲸叫声脉冲和长鳍领航鲸叫声脉冲的特征提取和精确分类的方法和装置。

第一步是确定鲸叫声脉冲特征提取和分类系统的总体方案。

鲸叫声脉冲特征提取和分类系统的总体方案框图如图1所示，其主要包括三个子系统：鲸叫声脉冲预处理子系统13，鲸叫声脉冲特征提取子系统14和鲸叫声脉冲特征分类子系统15。其中，鲸叫声脉冲预处理子系统13包括：水听器1(声音采集)，声音存储介质2(声音存储)，声音去噪模块3和端点检测模块4；鲸叫声脉冲特征提取子系统14包括连续小波变换预处理模块5，有效系数区域提取模块6，频率特征提取模块7和时间特征提取模块8；鲸叫声脉冲特征分类子系统包括特征向量拼合模块9，分类器训练模块10，分类器分类模块11和分类结果显示模块12，以上模块可依托于DSP、FPGA、ARM等硬件平台实现。

水听器1采集或者计算机存储介质2存储的含有鲸叫声脉冲的声音，首先经过声音去噪，得到去噪后的声音信号，经过端点检测模块，提取出含有鲸叫声脉冲的特征帧。进一步地，特征帧经过连续小波变换，得到连续小波变换系数矩阵。系数矩阵所有系数取绝对值后，得到绝对值系数矩阵。绝对值矩阵首先经过有效系数提取模块，得到有效系数区域，基于有效系数区域的频率特征提取算法和时间特征提取算法，得到特征向量。进一步地，特征向量被送入先前已训练过的BP神经网络分类器后，分类器对特征向量进行分类，输出分类结果。

第二步是设计了一种鲸叫声脉冲特征提取模型。

如图2所示，经过鲸叫声脉冲预处理子系统13得出的鲸叫声脉冲特征帧16，首先通过连续小波变换预处理模块17进行连续小波变换，选择7阶Symlets小波函数作为连续小波变换的母小波。经过连续小波变换分解后，得到鲸叫声脉冲特征帧的连续小波变换系数矩阵，进一步地，小波系数矩阵所有系数取绝对值后，得到绝对值系数矩阵18。

进一步地，绝对值矩阵包含大量其值不代表鲸叫声脉冲特征的系数。在特征提取过程之前，首先提取绝对值系数矩阵的有效系数区域(ECA)24：(1)在绝对值系数矩阵中，计算矩阵中每个尺度下的系数平均值20，并标记为T_i,i＝1,2,…,n,其中n是尺度数量。(2)将矩阵中的每个系数与其对应尺度下的T_i进行比较，如果系数值大于T_i，则保留为有效系数22，否则删除该系数。(3)所有有效系数组成了有效系数区域(ECA)23。ECA保留了表征鲸叫声脉冲特征的系数，并丢弃了无用系数。

进一步地，基于ECA，将ECA中相同尺度i的有效系数相加求得S(i),i＝1,2,…n,其中n是尺度数量。

进一步地，尺度区间可以被等分成几个子区间I_j,j＝1,2,…m，其中m是子区间总数。S(i)在每个子区间中进一步相加得到E_j：

式中j＝1,2,…m,m是子区间总数，m<n；I_j是子区间范围。所有E_j构成了频率特征29。

进一步地，鲸叫声脉冲持续时间也是对两种鲸叫声脉冲进行分类的重要特征。通过以下过程提取时间特征34：(1)基于ECA，计算ECA中每个尺度i的有效系数数量，并将其标记为N_i,i＝1,2,…,n,其中n是尺度数量。(2)将N_i的最大值标记为N_max。(3)时间特征t_d通过下式计算：

式中f_s是声音信号的采样率。

进一步地，频率特征29和时间特征34构成特征向量36。

第三步是设计了一种鲸叫声脉冲特征分类模型。

如图2所示，使用BP神经网络作为鲸叫声脉冲特征分类器43，首先合理设定分类器参数38，包括网络层数、输入层、隐含层节点数、输出层神经元个数、传递函数、训练方法、神经网络的初始权值、误差容限、学习率、动量因子、最大迭代次数和第一代初始参数等。进一步地，经过鲸叫声脉冲特征提取子系统14得到的鲸叫声脉冲特征向量16，选择若干特征向量作为训练数据40，对神经网络进行训练。神经网络训练完成后，待分类信号44被送入分类器，根据分类器的输出结果进行分类决策，最后输出最终分类结果47。

下面结合附图和实施例对本发明做进一步说明。

第一步：原始声音去噪过程和鲸叫声脉冲探测过程。

水听器1采集或者计算机存储介质2存储的含有鲸叫声脉冲的声音首先需要经过去噪处理，以减少噪音的影响。基于鲸叫声脉冲的非平稳瞬态特性，采用小波去噪阈值去噪的方法。使用7阶Symlets小波函数进行10层小波分解，进一步地，使用通用值(n是信号的长度)作为硬阈值，用该阈值函数对各层系数进行量化，最后用处理后的系数重构信号，得到去噪信号。

进一步地，去噪信号通过双门限端点检测算法检测鲸叫声脉冲的起始点与结束点。该算法中利用短时能量和短时平均过零率进行端点检测，双门限端点检测算法能够以低计算量实现快速准确的鲸叫声脉冲检测。每个鲸叫声脉冲检测估计中心位置t由下式计算：

其中t_on和t_off是通过双门限端点检测算法检测到的鲸叫声脉冲的起始点与结束点。

进一步地，以中心位置t为中心，提取合适点数的信号，作为鲸叫声脉冲特征帧。

第二步：叫声脉冲信号连续小波分解与有效系数提取过程。

经过鲸叫声脉冲预处理子系统13得出的鲸叫声脉冲特征帧16，首先通过连续小波变换预处理模块17进行连续小波变换，选择7阶Symlets小波函数作为连续小波变换的母小波，分解层数设定为400。连续小波变换分解后，得到鲸叫声脉冲特征帧的小波系数矩阵，进一步地，小波系数矩阵所有系数取绝对值后，得到绝对值系数矩阵18。

第三步：频率特征和时间特征提取过程。

式中j＝1,2,…m,m是子区间总数，m<n；I_j是子区间范围。设定m＝10，则可以得到10个频率特征值，所有E_j构成了频率特征29。

进一步地，鲸叫声脉冲持续时间也是对两种鲸叫声脉冲进行分类的一个重要特征。通过以下过程提取时间特征：(1)基于ECA，计算ECA中每个尺度i的有效系数数量，并将其标记为N_i,i＝1,2,…,n,其中n是尺度数量。(2)将N_i的最大值标记为N_max。(3)时间特征t_d通过下式计算：

式中f_s是声音信号的采样率。

进一步地，频率特征29和时间特征34构成特征向量36。

第四步：分类器训练、测试和分类过程。

进一步地，使用BP神经网络作为鲸叫声脉冲特征分类器43，首先合理设定分类器参数38，设定分类器的初始结构，设定网络层数、输入层、隐含层节点数、输出层神经元个数、传递函数、训练方法和神经网络的初始权值等参数。

进一步地，经过鲸叫声脉冲特征提取子系统14得到的鲸叫声脉冲特征向量16，随机选择若干特征向量作为训练数据40，设定误差容限、学习率、动量因子、最大迭代次数和第一代初始参数等，对神经网络进行训练。神经网络训练完成后，将分类特征向量送入分类器，根据分类器的输出结果进行分类决策，最后输出分类结果47。

Claims

1.一种抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类装置，其特征是，由三个子系统构成：鲸叫声脉冲预处理子系统，鲸叫声脉冲特征提取子系统和鲸叫声脉冲特征分类子系统，其中，鲸叫声脉冲预处理子系统包括：水听器，声音存储介质，声音去噪模块和端点检测模块；鲸叫声脉冲特征提取子系统包括连续小波变换预处理模块，有效系数区域提取模块，频率特征提取模块和时间特征提取模块；鲸叫声脉冲特征分类子系统包括特征向量拼合模块，分类器训练模块，分类器分类模块和分类结果显示模块；

2.如权利要求1所述的抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类装置，其特征是，鲸叫声脉冲特征提取子系统各模块可设置于DSP、FPGA或ARM硬件平台，鲸叫声脉冲特征分类子系统各模块可设置于DSP、FPGA或ARM硬件平台。

3.如权利要求1所述的抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类装置，其特征是，选择7阶Symlets小波函数作为连续小波变换的母小波。

4.如权利要求1所述的抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类装置，其特征是，经有效系数区域提取模块中，首先提取绝对值系数矩阵的有效系数区域，(1)在绝对值系数矩阵中，计算矩阵中每个尺度下的系数平均值，并标记为T_i,i＝1,2,…,n,其中n是尺度数量，(2)将矩阵中的每个系数与其对应尺度下的T_i进行比较，如果系数值大于T_i，则保留为有效系数，否则删除该系数；(3)所有有效系数组成了有效系数区域ECA(EffectiveCoefficient Area,)，ECA保留了表征鲸叫声脉冲特征的系数，并丢弃了无用系数；

<mrow> <msub> <mi>E</mi> <mi>j</mi> </msub> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>s</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&Element;</mo> <msub> <mi>I</mi> <mi>j</mi> </msub> </mrow> </munder> <mi>S</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow>

式中f_s是声音信号的采样率。

5.如权利要求1所述的抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类装置，其特征是，分类模块中，使用反向传播神经网络BP(Back Propagation Network)作为鲸叫声脉冲特征分类器，首先设定分类器参数，包括网络层数、输入层、隐含层节点数、输出层神经元个数、传递函数、训练方法、神经网络的初始权值、误差容限、学习率、动量因子、最大迭代次数和第一代初始参数，进一步地，经过鲸叫声脉冲特征提取子系统得到的鲸叫声脉冲特征向量，选择若干特征向量作为训练数据，对神经网络进行训练。神经网络训练完成后，待分类信号被送入分类器，根据分类器的输出结果进行分类决策，最后输出最终分类结果。

6.一种抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类方法，其特征是，步骤如下：

第一步：原始声音去噪过程和鲸叫声脉冲探测过程

第二步：叫声脉冲信号连续小波分解与有效系数提取过程

第三步：频率特征和时间特征提取过程。

式中f_s是声音信号的采样率。

进一步地，频率特征和时间特征构成特征向量；

第四步：分类器训练、测试和分类过程