CN117727333B - 基于声学识别的生物多样性监测方法及系统 - Google Patents
基于声学识别的生物多样性监测方法及系统 Download PDFInfo
- Publication number
- CN117727333B CN117727333B CN202410179362.5A CN202410179362A CN117727333B CN 117727333 B CN117727333 B CN 117727333B CN 202410179362 A CN202410179362 A CN 202410179362A CN 117727333 B CN117727333 B CN 117727333B
- Authority
- CN
- China
- Prior art keywords
- cluster
- nodes
- time
- node
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012544 monitoring process Methods 0.000 title claims abstract description 32
- 239000013598 vector Substances 0.000 claims abstract description 19
- 230000000877 morphologic effect Effects 0.000 claims abstract description 18
- 230000002093 peripheral effect Effects 0.000 claims abstract description 18
- 230000001788 irregular Effects 0.000 claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 38
- 230000011218 segmentation Effects 0.000 claims description 13
- 230000005856 abnormality Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 238000010845 search algorithm Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 2
- 241000894007 species Species 0.000 abstract description 14
- 230000000694 effects Effects 0.000 abstract description 8
- 238000004458 analytical method Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及生物多样性分析技术领域,具体涉及基于声学识别的生物多样性监测方法及系统,该方法包括:获取保护区声音语谱图,构建各保护区声音语谱图的无向图,进而获取节点路径序列以及可达中间节点;获取代表路径差异系数,进而获取各节点之间的节点邻近相似指数;根据节点邻近相似指数获取第一聚类簇,获取第一聚类簇的中心频率,获取各第一聚类簇的最外围时频单元,进而获取轮廓不规则系数;获取最外围时频单元的曲率偏差值,进而获取轮廓曲率离散系数,计算轮廓形态复杂指数;获取各第一聚类簇的形态特征向量,进而获取各第二聚类簇,对生物物种进行识别。本发明旨在解决解决生物鸣叫声音和人类活动声音无法进行准确区分的问题。
Description
技术领域
本发明涉及生物多样性分析技术领域,具体涉及基于声学识别的生物多样性监测方法及系统。
背景技术
在生态学中,生物多样性是评价一个生态环境的重要指标之一,生物多样性能够维持着生态系统的平衡,不同生物之间相互依存、相互作用,形成复杂的生态网络,对自然保护区的稳定和可持续发展具有极为重要的意义。同时由于不同生物种类通常具有独特的声音特征,因此作为一种非侵入性的监测方式,声学手段是监测和分析生态系统生物活动规律、评价生态系统健康状况的一种重要方法,有助于了解整个生态系统中各个物种的分布、行为和相互作用。
传统基于声学手段进行生物多样性监测中,主要采用统计分析的方法,分析的目标侧重在频谱特征的复杂性和差异性上,然而传统频谱特征往往需要手动调整参数或特征选择,而基于语谱图的面向对象分类方式,可以进行自适应的生物声音信息提取。其中传统聚类算法如K-means算法简单易实现,但是需要提前设置聚类簇的个数,即生物物种的个数,基于密度的DBSCAN聚类算法,无需提前设置聚类簇的个数,但是存在生物鸣叫和人类活动声音无法区分的问题。
发明内容
为了解决上述技术问题,本发明的目的在于提供基于声学识别的生物多样性监测方法及系统,所采用的技术方案具体如下:
第一方面,本发明实施例提供了基于声学识别的生物多样性监测方法,该方法包括以下步骤:
获取各时序区间的保护区声音语谱图,将保护区声音语谱图中每个声音数据点作为一个时频单元;
根据保护区声音语谱图中的时频单元构建各保护区声音语谱图的无向图,使用广度优先搜索算法获取无向图中各节点之间的节点路径序列,根据大津阈值分割法获取节点路径序列中的可达中间节点;根据时频单元的能量值分布和各节点之间的最短可达路径长度获取各可达中间节点的中间代表路径的代表路径差异系数;根据代表路径差异系数、中间代表路径序列中节点的个数、可达中间节点的个数和最短可达路径长度获取各节点之间的节点邻近相似指数;根据节点邻近相似指数获取第一聚类簇,根据时频单元的声音频率获取第一聚类簇的中心频率,使用快速凸包算法获取各第一聚类簇的最外围时频单元,根据最外围时频单元获取各第一聚类簇的轮廓不规则系数;根据时频单元的曲率获取最外围时频单元的曲率偏差值,根据曲率偏差值获取各第一聚类簇的轮廓曲率离散系数,根据轮廓不规则系数和轮廓曲率离散系数获取各第一聚类簇的轮廓形态复杂指数;根据中心频率、轮廓不规则系数、轮廓曲率离散系数和轮廓形态复杂指数获取各第一聚类簇的形态特征向量;
根据第一聚类簇的形态特征向量获取各第二聚类簇,根据生物识别模型获取第二聚类簇的生物物种。
进一步,所述根据保护区声音语谱图中的时频单元构建各保护区声音语谱图的无向图,使用广度优先搜索算法获取无向图中各节点之间的节点路径序列,包括:
对于各保护区声音语谱图,将保护区声音语谱图中各时频单元都作为一个节点,将各个时频单元与其八邻域内的时频单元进行连线获取无向图;
采用广度优先搜索算法,输入无向图,获取各节点之间的所有路径,其中,将各节点之间的每条路径中经过的节点按照经过的先后顺序排列组成节点路径序列。
进一步,所述根据大津阈值分割法获取节点路径序列中的可达中间节点,包括:
对于各节点之间的所有节点路径序列中的节点,统计每个节点在所有节点路径序列中出现的次数,将各节点之间的所有节点路径序列中所有节点的次数作为大津阈值分割法的输入,输出为数目分割阈值,将次数大于等于数目分割阈值的节点作为各节点之间的各节点路径序列中的可达中间节点。
进一步,所述获取各可达中间节点的中间代表路径的代表路径差异系数,包括:
计算以各节点为中心的、边长为5的方形窗口中所有时频单元的分布直方图作为各节点的能量分布;
对于所有节点路径序列中的各可达中间节点,将最短的节点路径序列作为各可达中间节点的中间代表路径序列,将中间代表路径序列从可达中间节点划分,得到各可达中间节点的左路径序列和右路径序列;
对于各可达中间节点,计算可达中间节点的左路径序列和右路径序列的各节点之间的能量分布的JS散度;
将各节点之间的最短路径经过的节点的个数作为各节点之间最短可达路径长度;计算可达中间节点的左路径序列和右路径序列的各节点之间的最短可达路径长度与所述JS散度的乘积,将可达中间节点的中间代表路径序列中所有乘积的均值作为各可达中间节点的中间代表路径的代表路径差异系数。
进一步,所述获取各节点之间的节点邻近相似指数,包括:
对于各节点之间的节点路径序列的各可达中间点,计算可达中间节点的中间代表路径序列中节点的个数与代表路径差异系数的和值的倒数,计算各节点之间所有倒数的和值作为第一和值;
计算第一和值与所述各节点之间所有可达中间节点的个数的比值,计算以自然常数为底、以所述最短可达路径长度为指数的指数函数的计算结果,将所述比值与所述计算结果的乘积作为各节点之间的节点邻近相似指数。
进一步,所述获取第一聚类簇,根据时频单元的声音频率获取第一聚类簇的中心频率,使用快速凸包算法获取各第一聚类簇的最外围时频单元,根据最外围时频单元获取各第一聚类簇的轮廓不规则系数,包括:
计算所有节点邻近相似指数的均值,将所有节点邻近相似指数大于等于节点邻近相似指数的均值两个节点作为真实时频相关组合,将所有真实时频相关组合中的节点进行连线,将真实时频相关组合中两节点之间的节点邻近相似指数作为边权重构成的无向图作为真实相关无向图;
采用马尔科夫聚类算法,输入为真实相关无向图,输出为各聚类簇,将所述聚类簇作为第一聚类簇;
对于各第一聚类簇,将第一聚类簇中的所有时频单元都作为LOF异常检测算法的输入,输出每个时频单元的LOF异常得分,将各时频单元的LOF异常得分的倒数作为时频单元的局部密度,将第一聚类簇中最大的局部密度时频单元作为第一聚类簇的中心时频单元,将各第一聚类簇中心时频单元的声音频率值作为各第一聚类簇的中心频率;
对于各第一聚类簇,使用快速凸包算法将第一聚类簇中的所有节点对应的时频单元作为输入,所述快速凸包算法的输出为各第一聚类簇的最外围时频单元集合在三维凸包上的集合,计算第一聚类簇的各最外围时频单元与中心时频单元的欧式距离,计算第一聚类簇上所有欧式距离的均值,计算所述欧式距离与所述均值的差值绝对值,将各第一聚类簇上所有差值绝对值的均值作为各第一聚类簇的轮廓不规则系数。
进一步,所述获取最外围时频单元的曲率偏差值,根据曲率偏差值获取各第一聚类簇的轮廓曲率离散系数,根据轮廓不规则系数和轮廓曲率离散系数获取各第一聚类簇的轮廓形态复杂指数,包括:
将第一聚类簇上第m个与第m+1个相邻最外围时频单元在三维凸包上的曲率的差值绝对值作为第一聚类簇上第m个最外围时频单元的曲率偏差率;
对于各第一聚类簇,计算第一聚类簇上所有最外围时频单元的曲率偏差率的均值,计算各最外围时频单元与所述均值的差值的平方,将各第一聚类簇中所有差值的平方的均值作为各第一聚类簇的轮廓曲率离散系数;
将各第一聚类簇的轮廓不规则系数与轮廓曲率离散系数的乘积作为各第一聚类簇的轮廓形态复杂指数。
进一步,所述获取各第一聚类簇的形态特征向量,包括:
将各第一聚类簇的中心频率、轮廓不规则系数、轮廓曲率离散系数和轮廓形态复杂指数排序组成的向量作为各第一聚类簇的形态特征向量。
进一步,所述获取各第二聚类簇,根据生物识别模型获取第二聚类簇的生物物种,包括:
将所有时序区间的保护区声音语谱图的第一聚类簇作为DBSCAN聚类算法的输入,度量距离为各第一聚类簇的归一化的形态特征向量的欧式距离,所述DBSCAN聚类算法的输出为各第二聚类簇;
将第二聚类簇中任意一个第一聚类簇中所有的时频单元使用短时傅立叶逆变换转换成声音数据输入到生物声音识别模型中,生物声音识别模型采用卷积神经网络,采用交叉熵作为生物声音识别模型的损失函数,采用批量梯度下降作为优化函数,所述生物声音识别模型的输出为第二聚类簇的生物物种。
第二方面,本发明实施例还提供了基于声学识别的生物多样性监测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。
本发明至少具有如下有益效果:
本发明实现一种基于声学识别的生物多样性监测方法及系统,根据保护区声音语谱图中各个时频单元之间的时间-频率特征,结合BFS算法和马尔科夫聚类算法,对一个时序区间对应的保护区声音语谱图进行分类,其有益效果在于考虑语谱图中各个时频单元之间的时间-频率特征和节点路径特征,避免两个时频单元具有较为相似的语音能量,但在时间-频率特征上差异较大的问题;根据马尔科夫聚类算法所得的第一聚类簇之间时频特征,结合LOF异常检测算法和快速凸包算法,构建第一聚类簇的轮廓形态复杂指数,其有益效果在于考虑生物鸣叫时,具有不同的轮廓形态特征,同时解决生物鸣叫声音和人类活动声音无法进行准确区分的问题,提高自然保护区生物多样性监测的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例提供的基于声学识别的生物多样性监测方法的步骤流程图;
图2为形态特征向量流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于声学识别的生物多样性监测方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于声学识别的生物多样性监测方法及系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于声学识别的生物多样性监测方法的步骤流程图,该方法包括以下步骤:
步骤S001,通过声音监测设备对自然保护区的声音数据进行采集,并采用短时傅立叶变换构建保护区声音语谱图。
将整体自然保护区均匀分成个保护区区域,在每个保护区区域中心位置都放置一个声音监测设备,以单声道、22kHz的采样频率、16bit的数据分辨率,对保护区区域的声音数据进行采集,采集时间长度为T,其中T取经验值为1小时。
进一步的,本实施例将一分钟作为一个时序区间,将采集所得的自然保护区声音数据分为N个时序区间,N取经验值60,将每个时序区间的保护区区域声音数据采用短时傅立叶变换,构建各个保护区区域对应的语谱图,短时傅立叶变换算法的窗口长度设为经验值10毫秒,其中短时傅立叶变换和语谱图的构建均为公知技术,在此不再赘述。
至此,得到各个保护区区域中任意时序区间对应的语谱图,为了方便后续描述,本实施例以其中任意一个保护区域为例,将该保护区区域中第n个时序区间对应的语谱图,记为第n个时序区间的保护区声音语谱图。
步骤S002,根据保护区声音语谱图中各个时频单元之间的时间频率分布特征和能量分布特征,可得节点邻近相似指数,采用马尔科夫聚类算法,根据第一聚类簇之间时频特征,结合LOF异常检测算法和快速凸包算法,构建第一聚类簇的轮廓形态复杂指数;采用DBSCAN聚类簇算法和生物声音识别模型获取自然保护区的生物物种个数。
声音语谱图的横坐标为时间,纵坐标为声音频率,语谱图中每个声音数据点都有对应的语音能量值。本实施例将语谱图中各声音数据点作为各时频单元。
将保护区声音语谱图中每一个时频单元都作为一个节点,将各个时频单元与其八邻域内的时频单元进行连线,根据节点连线结果构建无向图。
由于自然保护区人类活动较少,对自然生物的影响情况较低,因此在语谱图中,属于生物同一次鸣叫声音的时频单元通常会聚集在一起,而且属于生物同一次鸣叫声音的两个时频单元之间应该具有较高的相似度,而且在语谱图中相距较近,则两个时频单元在无向图中应该也具有较强的相似性、相距较近。
基于上述分析,以所述无向图中第x、y个节点为例,采用广度优先搜索(Breadth-First Search, BFS)算法,输入无向图,获取所有从x节点到y节点的所有路径,其中,将所得每条路径中经过的节点按照经过的先后顺序,依次组成节点路径序列。
进一步的,以第x、y个节点的所有节点路径序列中的节点为例,统计每个节点在所有节点路径序列中出现的次数,将第x、y个节点的所有节点路径序列中所有节点的次数作为大津阈值分割法的输入,输出为数目分割阈值,将次数大于等于数目分割阈值的节点作为第x、y个节点的各节点路径序列中的可达中间节点。
以第i个可达中间节点为例,将包含第i个可达中间节点的最短的节点路径序列作为第i个可达中间节点的中间代表路径序列。进一步的,将上述中间代表路径序列中从x节点到i中间节点的部分序列,记为左路径序列,将从i中间节点到y节点的部分序列,记为右路径序列。
基于上述分析可得,无向图中第x、y个节点之间的节点邻近相似指数:
其中,是第i个可达中间节点的中间代表路径序列的代表路径差异系数,/>是第i个可达中间节点对应的左路径序列中第q个节点的能量分布,/>的获取方式为:以第q个节点对应的时频单元为中心,获取5*5窗口内所有时频单元的语音能量的分布直方图作为第q个节点的能量分布,/>是第i个可达中间节点对应的右路径序列中第p个节点的能量分布,是计算两个节点能量分布/>之间的JS散度,/>是左路径序列中第q个节点与右路径序列p节点之间的最短可达路径长度,计算方式为:两个节点之间最短路径经过的节点个数,即为最短可达路径长度,/>、/>分别是第i个可达中间节点对应的右路径序列、左路径序列的节点个数。其中,JS散度的计算方法为公知技术,在此不做赘述。
当右路径序列与左路径序列中的节点之间的JS散度越大,即越大,说明两个节点之间的能量分布差异越大,同时当右路径序列与左路径序列中的节点之间的最短可达路径长度越远,即/>越大,说明在语谱图中两个节点相隔可能越远,两个节点之间具有较大的差异性,则可达中间节点对应中间代表路径序列中左、右路径序列的差异越大,代表路径差异系数/>越大。
是无向图中第x、y个节点之间的节点邻近相似指数,/>是第i个可达中间节点的中间代表路径序列中节点的个数,/>是第x、y个节点之间所有可达中间节点的个数,/>是第x、y个节点之间的最短可达路径长度。
当可达中间节点对应中间代表路径序列中左、右路径序列的差异越小,即越小,说明可达中间节点对应的中间代表路径序列中各个节点之间的相似度越高,以第i个可达中间节点为基础,x、y节点之间越可能也具有较高的相似度,同时当中间代表路径序列中节点的个数越少,即/>越少,说明以第i个可得中间节点为基础,x、y节点之间的路径需要经过的节点个数越少,则x、y节点可能越相似、相隔越近,节点邻近相似指数/>越大;当x、y两个节点之间的最短可达路径长度越小,即/>越小,说明在语谱图中两个节点相隔可能越近,两个无向图在语谱图中相似度越高,则节点邻近相似指数/>越大。
至此,可得保护区声音语谱图中任意两个节点之间的节点邻近相似指数,计算所有节点邻近相似指数的均值,记为/>,将所有节点邻近相似指数大于等于节点邻近相似指数的均值/>的两个节点,记为真实时频相关组合;
进一步的,将保护区声音语谱图中每一个时频单元都作为一个节点,将所有属于真实时频相关组合的节点进行连线,将真实时频相关组合中两节点之间的节点邻近相似指数作为边权重,将节点连线构成的无向图,记为真实相关无向图。
进一步的,采用马尔科夫聚类算法,输入为真实相关无向图,输出为K个聚类簇,将所述聚类簇作为第一聚类簇,其中,k的经验值为10,马尔科夫聚类算法为公知技术,具体过程不再赘述。
在自然保护区中,为了对自然保护区的地理信息、生态学数据进行采集,同时为了防止自然保护区出现偷猎、盗伐等事件,自然保护区内往往会不可避免的出现一些人类活动,比如无人机监测。
在语谱图中,这些属于人类活动的时频单元可能也会聚集在一起,也具有较高的相似度,导致所述第一聚类簇无法确定哪些属于生物鸣叫,哪些属于人类活动,存在无法进行准确区分的问题。同时,在自然保护区中为了防止无人机对自然保护区生态系统和生物造成较大的干扰,影响生物的行为和栖息地的选择,无人机的飞行速度较快,时长较短,在各个时序区间中出现的比例较低,而自然保护区中同一物种的生物个数通常较多,在各个时序区间中同一生物鸣叫的声音出现比例较高,而且每种生物在鸣叫时具有相似的时频特征。
获取各个时序区域的保护区声音语谱图的所有第一聚类簇,以其中第v个第一聚类簇为例,将第v个第一聚类簇中的所有时频单元都作为LOF异常检测算法的输入,输出每个时频单元对应的LOF异常得分,将每个时频单元的LOF异常得分的倒数作为对应时频单元的局部密度,将第v个第一聚类簇中最大的局部密度时频单元作为第一聚类簇中心,将第一聚类簇中心时频单元的声音频率值作为第一聚类簇的中心频率。
进一步的,采用快速凸包(QuickHull)算法,将第v个第一聚类簇中的所有节点对应的时频单元作为输入,输出为三维凸包和三维凸包上各个第一聚类簇时频单元的集合,即为第v个第一聚类簇的最外围时频单元集合,从距离第一聚类簇中心最远的最外围时频单元开始编号,记为1,按照顺时钟顺序,在凸包上依次对最外围时频单元进行编号。其中,上述LOF异常检测算法和快速凸包算法均为公知技术,具体过程不再赘述。
基于上述分析,可得第v个第一聚类簇的轮廓形态复杂指数:
其中,是第v个第一聚类簇的轮廓不规则系数,/>是第v个第一聚类簇第m个最外围时频单元与第一聚类簇中心时频单元的欧氏距离,/>是第v个第一聚类簇中所有最外围时频单元与第一聚类簇中心的欧氏距离均值,/>是第v个第一聚类簇最外围时频单元的总个数。当最外围时频单元与第一聚类簇中心的欧氏距离与均值/>相差越大,即越大,说明第一聚类簇的最外围时频单元分布越离散,同时第一聚类簇的最外围时频单元也是整体第一聚类簇的整体轮廓,即第一聚类簇的轮廓越不规则,轮廓不规则系数/>越大。
是第v个第一聚类簇中第m个最外围时频单元的曲率偏差值,/>分别是第v个第一聚类簇中第m+1个、第m个最外围时频单元在三维凸包中的曲率;/>是第v个第一聚类簇的轮廓曲率离散系数,/>是第v个第一聚类簇中所有曲率偏差值的均值。当第一聚类簇中编号相邻的两个最外围时频单元曲率相差越大,即/>越大,曲率偏差值/>越大,说明第一聚类簇凸包上各个最外围时频单元的曲率值越离散,即轮廓曲率离散系数/>越大。
是第v个第一聚类簇的轮廓形态复杂指数。当第一聚类簇的轮廓越不规则,同时轮廓上时频单元曲率越离散,即/>越大,说明第一聚类簇的形态越复杂、越不规整,即轮廓形态复杂指数/>越大。
根据上述步骤,获取第v个第一聚类簇的中心频率、轮廓不规则系数/>、轮廓曲率离散系数/>、轮廓形态复杂指数/>组成第一聚类的簇形态特征向量。采用上述相同的计算方法,可得各个第一聚类簇的形态特征向量。形态特征向量流程图如图2所示。由于组成形态特征向量的指标量纲不同,采用线性归一化消除量纲影响,再将所有时序区间的保护区声音语谱图的第一聚类簇作为DBSCAN聚类算法的输入,其中将邻域半径(/>)设为经验值0.1,最小邻域点数(MinPts)设为5,度量距离采用欧式距离,计算的是各第一聚类簇的归一化后的形态特征向量的欧式距离,输出为/>个由多个第一聚类簇组成的第二聚类簇,每个第二聚类簇均有可能为语谱图中一个生物物种音频信号,聚类簇的数量越多,自然保护区的物种可能越丰富,生物多样性也越高。其中线性归一化和DBSCAN聚类算法均为公知技术,具体过程不再赘述。
其次,获取其中一个第二聚类簇中任意第一聚类簇,将上述第一聚类簇中所有的时频单元使用短时傅立叶逆变换(Inverse Short-Time Fourier Transform)转换成声音数据输入到生物声音识别模型中,生物声音识别模型采用卷积神经网络(CNN)的架构,采用交叉熵作为生物声音识别模型的损失函数,采用批量梯度下降(Batch Gradient Descent)作为优化函数,输出为第二聚类簇的生物物种。最后根据上述步骤,可得所有第二聚类簇对应的生物物种,统计实际自然保护区中生物物种的实际总个数,该值越大,说明自然保护区的生物多样性越丰富。
基于与上述方法相同的发明构思,本发明实施例还提供了基于声学识别的生物多样性监测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于声学识别的生物多样性监测方法中任意一项所述方法的步骤。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于声学识别的生物多样性监测方法,其特征在于,该方法包括以下步骤:
获取各时序区间的保护区声音语谱图,将保护区声音语谱图中每个声音数据点作为一个时频单元;
根据保护区声音语谱图中的时频单元构建各保护区声音语谱图的无向图,使用广度优先搜索算法获取无向图中各节点之间的节点路径序列,根据大津阈值分割法获取节点路径序列中的可达中间节点;根据时频单元的能量值分布和各节点之间的最短可达路径长度获取各可达中间节点的中间代表路径的代表路径差异系数;根据代表路径差异系数、中间代表路径序列中节点的个数、可达中间节点的个数和最短可达路径长度获取各节点之间的节点邻近相似指数;根据节点邻近相似指数获取第一聚类簇,根据时频单元的声音频率获取第一聚类簇的中心频率,使用快速凸包算法获取各第一聚类簇的最外围时频单元,根据最外围时频单元获取各第一聚类簇的轮廓不规则系数;根据时频单元的曲率获取最外围时频单元的曲率偏差值,根据曲率偏差值获取各第一聚类簇的轮廓曲率离散系数,根据轮廓不规则系数和轮廓曲率离散系数获取各第一聚类簇的轮廓形态复杂指数;根据中心频率、轮廓不规则系数、轮廓曲率离散系数和轮廓形态复杂指数获取各第一聚类簇的形态特征向量;
根据第一聚类簇的形态特征向量获取各第二聚类簇,根据生物识别模型获取第二聚类簇的生物物种。
2.如权利要求1所述的基于声学识别的生物多样性监测方法,其特征在于,所述根据保护区声音语谱图中的时频单元构建各保护区声音语谱图的无向图,使用广度优先搜索算法获取无向图中各节点之间的节点路径序列,包括:
对于各保护区声音语谱图,将保护区声音语谱图中各时频单元都作为一个节点,将各个时频单元与其八邻域内的时频单元进行连线获取无向图;
采用广度优先搜索算法,输入无向图,获取各节点之间的所有路径,其中,将各节点之间的每条路径中经过的节点按照经过的先后顺序排列组成节点路径序列。
3.如权利要求2所述的基于声学识别的生物多样性监测方法,其特征在于,所述根据大津阈值分割法获取节点路径序列中的可达中间节点,包括:
对于各节点之间的所有节点路径序列中的节点,统计每个节点在所有节点路径序列中出现的次数,将各节点之间的所有节点路径序列中所有节点的次数作为大津阈值分割法的输入,输出为数目分割阈值,将次数大于等于数目分割阈值的节点作为各节点之间的各节点路径序列中的可达中间节点。
4.如权利要求2所述的基于声学识别的生物多样性监测方法,其特征在于,所述获取各可达中间节点的中间代表路径的代表路径差异系数,包括:
计算以各节点为中心的、边长为5的方形窗口中所有时频单元的分布直方图作为各节点的能量分布;
对于所有节点路径序列中的各可达中间节点,将最短的节点路径序列作为各可达中间节点的中间代表路径序列,将中间代表路径序列从可达中间节点划分,得到各可达中间节点的左路径序列和右路径序列;
对于各可达中间节点,计算可达中间节点的左路径序列和右路径序列的各节点之间的能量分布的JS散度;
将各节点之间的最短路径经过的节点的个数作为各节点之间最短可达路径长度;计算可达中间节点的左路径序列和右路径序列的各节点之间的最短可达路径长度与所述JS散度的乘积,将可达中间节点的中间代表路径序列中所有乘积的均值作为各可达中间节点的中间代表路径的代表路径差异系数。
5.如权利要求4所述的基于声学识别的生物多样性监测方法,其特征在于,所述获取各节点之间的节点邻近相似指数,包括:
对于各节点之间的节点路径序列的各可达中间点,计算可达中间节点的中间代表路径序列中节点的个数与代表路径差异系数的和值的倒数,计算各节点之间所有倒数的和值作为第一和值;
计算第一和值与所述各节点之间所有可达中间节点的个数的比值,计算以自然常数为底、以所述最短可达路径长度为指数的指数函数的计算结果,将所述比值与所述计算结果的乘积作为各节点之间的节点邻近相似指数。
6.如权利要求1所述的基于声学识别的生物多样性监测方法,其特征在于,所述获取第一聚类簇,根据时频单元的声音频率获取第一聚类簇的中心频率,使用快速凸包算法获取各第一聚类簇的最外围时频单元,根据最外围时频单元获取各第一聚类簇的轮廓不规则系数,包括:
计算所有节点邻近相似指数的均值,将所有节点邻近相似指数大于等于节点邻近相似指数的均值两个节点作为真实时频相关组合,将所有真实时频相关组合中的节点进行连线,将真实时频相关组合中两节点之间的节点邻近相似指数作为边权重构成的无向图作为真实相关无向图;
采用马尔科夫聚类算法,输入为真实相关无向图,输出为各聚类簇,将所述聚类簇作为第一聚类簇;
对于各第一聚类簇,将第一聚类簇中的所有时频单元都作为LOF异常检测算法的输入,输出每个时频单元的LOF异常得分,将各时频单元的LOF异常得分的倒数作为时频单元的局部密度,将第一聚类簇中最大的局部密度时频单元作为第一聚类簇的中心时频单元,将各第一聚类簇中心时频单元的声音频率值作为各第一聚类簇的中心频率;
对于各第一聚类簇,使用快速凸包算法将第一聚类簇中的所有节点对应的时频单元作为输入,所述快速凸包算法的输出为各第一聚类簇的最外围时频单元集合在三维凸包上的集合,计算第一聚类簇的各最外围时频单元与中心时频单元的欧式距离,计算第一聚类簇上所有欧式距离的均值,计算所述欧式距离与所述均值的差值绝对值,将各第一聚类簇上所有差值绝对值的均值作为各第一聚类簇的轮廓不规则系数。
7.如权利要求6所述的基于声学识别的生物多样性监测方法,其特征在于,所述获取最外围时频单元的曲率偏差值,根据曲率偏差值获取各第一聚类簇的轮廓曲率离散系数,根据轮廓不规则系数和轮廓曲率离散系数获取各第一聚类簇的轮廓形态复杂指数,包括:
将第一聚类簇上第m个与第m+1个相邻最外围时频单元在三维凸包上的曲率的差值绝对值作为第一聚类簇上第m个最外围时频单元的曲率偏差率;
对于各第一聚类簇,计算第一聚类簇上所有最外围时频单元的曲率偏差率的均值,计算各最外围时频单元与所述均值的差值的平方,将各第一聚类簇中所有差值的平方的均值作为各第一聚类簇的轮廓曲率离散系数;
将各第一聚类簇的轮廓不规则系数与轮廓曲率离散系数的乘积作为各第一聚类簇的轮廓形态复杂指数。
8.如权利要求1所述的基于声学识别的生物多样性监测方法,其特征在于,所述获取各第一聚类簇的形态特征向量,包括:
将各第一聚类簇的中心频率、轮廓不规则系数、轮廓曲率离散系数和轮廓形态复杂指数排序组成的向量作为各第一聚类簇的形态特征向量。
9.如权利要求1所述的基于声学识别的生物多样性监测方法,其特征在于,所述获取各第二聚类簇,根据生物识别模型获取第二聚类簇的生物物种,包括:
将所有时序区间的保护区声音语谱图的第一聚类簇作为DBSCAN聚类算法的输入,度量距离为各第一聚类簇的归一化的形态特征向量的欧式距离,所述DBSCAN聚类算法的输出为各第二聚类簇;
将第二聚类簇中任意一个第一聚类簇中所有的时频单元使用短时傅立叶逆变换转换成声音数据输入到生物声音识别模型中,生物声音识别模型采用卷积神经网络,采用交叉熵作为生物声音识别模型的损失函数,采用批量梯度下降作为优化函数,所述生物声音识别模型的输出为第二聚类簇的生物物种。
10.基于声学识别的生物多样性监测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179362.5A CN117727333B (zh) | 2024-02-18 | 2024-02-18 | 基于声学识别的生物多样性监测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179362.5A CN117727333B (zh) | 2024-02-18 | 2024-02-18 | 基于声学识别的生物多样性监测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117727333A CN117727333A (zh) | 2024-03-19 |
CN117727333B true CN117727333B (zh) | 2024-04-23 |
Family
ID=90207415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410179362.5A Active CN117727333B (zh) | 2024-02-18 | 2024-02-18 | 基于声学识别的生物多样性监测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117727333B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118072206A (zh) * | 2024-04-24 | 2024-05-24 | 中国科学院水生生物研究所 | 基于鲸类栖息地选择模型的无人机遥感图像目标识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013181222A2 (en) * | 2012-05-29 | 2013-12-05 | Battelle Memorial Institute | Method of analyzing a graph with a covariance-based clustering algorithm using a modified laplacian pseudo-inverse matrix |
CN112750442A (zh) * | 2020-12-25 | 2021-05-04 | 浙江弄潮儿智慧科技有限公司 | 一种具有小波变换的朱鹮种群生态体系监测系统及其小波变换方法 |
CN115083433A (zh) * | 2022-06-06 | 2022-09-20 | 蒋竺芳 | 一种基于dnn的文本无关表征音色聚类方法 |
CN116110405A (zh) * | 2023-04-11 | 2023-05-12 | 四川大学 | 一种基于半监督学习的陆空通话说话人识别方法及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
-
2024
- 2024-02-18 CN CN202410179362.5A patent/CN117727333B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013181222A2 (en) * | 2012-05-29 | 2013-12-05 | Battelle Memorial Institute | Method of analyzing a graph with a covariance-based clustering algorithm using a modified laplacian pseudo-inverse matrix |
CN112750442A (zh) * | 2020-12-25 | 2021-05-04 | 浙江弄潮儿智慧科技有限公司 | 一种具有小波变换的朱鹮种群生态体系监测系统及其小波变换方法 |
CN115083433A (zh) * | 2022-06-06 | 2022-09-20 | 蒋竺芳 | 一种基于dnn的文本无关表征音色聚类方法 |
CN116110405A (zh) * | 2023-04-11 | 2023-05-12 | 四川大学 | 一种基于半监督学习的陆空通话说话人识别方法及设备 |
Non-Patent Citations (1)
Title |
---|
基于局部密度构造相似矩阵的谱聚类算法;吴健;崔志明;时玉杰;盛胜利;龚声蓉;;通信学报;20130325(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117727333A (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Doan et al. | Underwater acoustic target classification based on dense convolutional neural network | |
Kong et al. | Sound event detection of weakly labelled data with cnn-transformer and automatic threshold optimization | |
CN109350032B (zh) | 一种分类方法、系统、电子设备及存储介质 | |
CN107822622B (zh) | 基于深度卷积神经网络的心电图诊断方法和系统 | |
CN111027487B (zh) | 基于多卷积核残差网络的行为识别系统、方法、介质及设备 | |
CN117727333B (zh) | 基于声学识别的生物多样性监测方法及系统 | |
Perna | Convolutional neural networks learning from respiratory data | |
CN107703486B (zh) | 一种基于卷积神经网络cnn的声源定位方法 | |
Abbood et al. | Speaker identification model based on deep neural networks | |
CN110164452A (zh) | 一种声纹识别的方法、模型训练的方法以及服务器 | |
CN111709299B (zh) | 一种基于加权支持向量机的水声目标识别方法 | |
CN113558603B (zh) | 一种基于深度学习的多模态认知障碍识别方法 | |
CN107110743A (zh) | 检查数据处理装置以及检查数据处理方法 | |
Phan et al. | Unifying isolated and overlapping audio event detection with multi-label multi-task convolutional recurrent neural networks | |
CN114091529A (zh) | 一种基于生成对抗网络数据增强的脑电情感识别方法 | |
CN114220164A (zh) | 一种基于变分模态分解和支持向量机的手势识别方法 | |
CN113837122A (zh) | 基于Wi-Fi信道状态信息的无接触式人体行为识别方法及系统 | |
CN111310680B (zh) | 一种基于深度学习的辐射源个体识别方法 | |
Schwenker et al. | Radial basis function neural networks and temporal fusion for the classification of bioacoustic time series | |
Ghoraani et al. | Discriminant non-stationary signal features’ clustering using hard and fuzzy cluster labeling | |
CN116049636A (zh) | 一种基于深度残差卷积神经网络的脑电情感识别方法 | |
CN104616656A (zh) | 一种基于改进abc算法的朱鹮鸣声码书设计方法 | |
Zhang et al. | Multi-feature decision fusion network for heart sound abnormality detection and classification | |
CN112465054B (zh) | 一种基于fcn的多变量时间序列数据分类方法 | |
CN113936667A (zh) | 一种鸟鸣声识别模型训练方法、识别方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |