CN117809662B - 一种基于鸟类特征识别的栖息地环境调节方法和系统 - Google Patents

一种基于鸟类特征识别的栖息地环境调节方法和系统 Download PDF

Info

Publication number
CN117809662B
CN117809662B CN202410220304.2A CN202410220304A CN117809662B CN 117809662 B CN117809662 B CN 117809662B CN 202410220304 A CN202410220304 A CN 202410220304A CN 117809662 B CN117809662 B CN 117809662B
Authority
CN
China
Prior art keywords
bird
voiceprint
data
characteristic
environmental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410220304.2A
Other languages
English (en)
Other versions
CN117809662A (zh
Inventor
郑福超
郑佳丽
方朝阳
芦恺
朱文典
吴永欢
高丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Normal University
Original Assignee
Jiangxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Normal University filed Critical Jiangxi Normal University
Priority to CN202410220304.2A priority Critical patent/CN117809662B/zh
Publication of CN117809662A publication Critical patent/CN117809662A/zh
Application granted granted Critical
Publication of CN117809662B publication Critical patent/CN117809662B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于鸟类特征识别的栖息地环境调节方法和系统。该系统包括声纹监测前端设备、环境监测装置、处理器和环境调节装置,该方法基于处理器执行,包括:基于从声纹监测前端设备获取的原始声音数据提取声纹数据;基于声纹数据确定鸟类声纹模型,基于鸟类声纹模型确定第一鸟类特征;基于第一鸟类特征和声纹数据,确定第二鸟类特征;基于从环境监测装置获取的环境数据和第二鸟类特征,确定分析结果;基于分析结果,确定环境调节参数和设备调动参数;将环境调节参数发送至对应的环境调节装置,将设备调动参数发送至对应的声纹监测前端设备。该方法可以精准识别鸟类物种,并根据鸟类特征对鸟类栖息地的环境进行调节从而维持鸟类种群多样性。

Description

一种基于鸟类特征识别的栖息地环境调节方法和系统
技术领域
本发明涉及声音识别领域,特别涉及一种基于鸟类特征识别的栖息地环境调节方法和系统。
背景技术
鸟类是生物多样性监测和生态环境影响评价的重要指标。通过鸟类物种的调查与监测可以了解鸟类资源现状,归纳鸟类物种的组成、数量和多样性等特征,基于以上特征能直接反映栖息地的环境质量、生态系统的健康程度、生物多样性状况、人类活动对生态系统的干扰程度以及土地利用和景观改变对生态系统的影响程度等。因此对鸟类物种的识别与分析十分重要。
专利CN110120224B公开了一种鸟声识别模型的构建方法,基于鸟声样本提取声纹特征,基于声纹特征进行训练得到鸟声识别模型,该鸟声识别模型可对包含鸟声的音频进行有效识别,识别出鸟的类别。然而该方法对于分析鸟类具体行为(如求偶、觅食等)以及物种种群特征(公鸟母鸟比例等)则存在难度。
因此,本发明提供一种基于鸟类特征识别的栖息地环境调节方法,可以基于原始声音数据确定鸟类特征,从而精准识别鸟类物种;同时结合环境数据和对鸟类栖息地的分析结果,确定鸟类的种群特征,且可以对鸟类栖息地的环境进行调节从而维持鸟类种群的数量、多样性等。
发明内容
本发明提供一种基于鸟类特征识别的栖息地环境调节方法,所述方法通过基于鸟类特征识别的栖息地环境调节系统实现,所述系统包括至少一个声纹监测前端设备、至少一个环境监测装置、处理器和至少一个环境调节装置,所述方法基于处理器执行,所述方法包括:基于从声纹监测前端设备获取的原始声音数据,提取声纹数据;基于所述声纹数据确定鸟类声纹模型,基于所述鸟类声纹模型确定多个预设时间段的第一鸟类特征,所述第一鸟类特征包括鸟类物种和各个所述鸟类物种对应的鸟类数量,所述鸟类声纹模型为深度卷积循环神经网络模型;基于所述多个预设时间段的所述第一鸟类特征和所述声纹数据,确定第二鸟类特征,所述第二鸟类特征包括种群行为特征以及种群规模;基于从环境监测装置获取的环境数据和所述第二鸟类特征,确定分析结果,所述分析结果包括至少一个栖息地的环境质量以及所述至少一个栖息地的设备更新数量和/或设备位置分布;基于所述分析结果,确定至少一组环境调节参数和至少一组设备调动参数,所述环境调节参数包括所述至少一个栖息地的蓄水量,所述至少一组设备调动参数包括至少一个声纹监测前端设备的设备位置;将所述至少一组环境调节参数发送至对应的环境调节装置,将所述至少一组设备调动参数发送至对应的声纹监测前端设备。
本发明提供一种基于鸟类特征识别的栖息地环境调节系统,所述系统包括至少一个声纹监测前端设备、至少一个环境监测装置、至少一个环境调节装置和处理器:所述声纹监测前端设备被配置为获取多个预设时间段的原始声音数据;所述环境监测装置被配置为获取环境数据;所述环境调节装置被配置为基于至少一组环境调节参数调节环境数据;所述处理器被配置为:基于原始声音数据提取声纹数据;基于所述声纹数据确定鸟类声纹模型,基于所述鸟类声纹模型确定多个预设时间段的第一鸟类特征,所述第一鸟类特征至少包括鸟类物种和对应的鸟类数量,所述鸟类声纹模型为深度卷积循环神经网络模型;基于所述多个预设时间段的所述第一鸟类特征和所述声纹数据,确定第二鸟类特征,所述第二鸟类特征至少包括种群行为特征以及种群规模;基于环境数据和所述第二鸟类特征,确定分析结果,所述分析结果包括至少一个栖息地的环境质量以及所述至少一个栖息地的设备更新数量和/或设备位置分布;基于所述分析结果,确定至少一组环境调节参数和至少一组设备调动参数,所述环境调节参数包括所述至少一个栖息地的蓄水量,所述至少一组设备调动参数包括至少一个声纹监测前端设备的设备位置;将所述至少一组环境调节参数发送至对应的环境调节装置,将所述至少一组设备调动参数发送至对应的声纹监测前端设备。
附图说明
本发明将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本发明一些实施例所示的基于鸟类特征识别的栖息地环境调节系统的示例性结构图;
图2是根据本发明一些实施例所示的基于鸟类特征识别的栖息地环境调节方法的示例性流程图;
图3是根据本发明一些实施例所示的鸟类声纹模型的示例性示意图;
图4是根据本发明一些实施例所示的通过鸟类行为模型确定第二鸟类特征的示例性示意图;
图5是根据本发明一些实施例所示的确定分析结果的示例性示意图。
具体实施方式
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本发明应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本申请使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本申请所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本发明中使用了流程图用来说明根据本发明的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是根据本发明一些实施例所示的基于鸟类特征识别的栖息地环境调节系统的示例性结构图。
在一些实施例中,如图1所示,基于鸟类特征识别的栖息地环境调节系统100可以包括至少一个声纹监测前端设备110、至少一个环境监测装置120、至少一个环境调节装置130和处理器140。
声纹监测前端设备110是用于采集栖息地的声音相关数据的设备。栖息地是指鸟类生存和分布的区域。在一些实施例中,声纹监测前端设备可以包括声音数据采集仪。为保证长期野外作业,声纹监测前端设备应具防水防尘功能。
在一些实施例中,声纹监测前端设备可以包括供电装置和通讯装置。供电装置用于给声纹监测前端设备供电,例如,供电装置可以被配置为太阳能板和电池组。通讯装置用于将声纹监测前端设备采集到的原始声音数据传输给处理器。例如,通讯装置可以被配置为无线通讯设备。
在一些实施例中,同一栖息地可以设置一个或多个声纹监测前端设备110。
在一些实施例中,声纹监测前端设备110可以被配置为获取原始声音数据。关于原始声音数据的更多内容可以参见图2及相关说明。
在一些实施例中,声纹监测前端设备110可以被配置为基于设备调动参数对声纹监测前端设备110进行调动。
环境监测装置120是用于监测栖息地的环境数据的装置。例如,环境监测装置可以被配置为温度传感器、湿度传感器等。在一些实施例中,同一栖息地内可以设置一个或多个环境监测装置120。
在一些实施例中,环境监测装置120被配置为获取环境数据。环境数据可以包括温度、湿度等。关于环境数据的更多内容可以参见图2及相关说明。
环境调节装置130是指可以实现对栖息地的环境数据进行调节的装置。在一些实施例中,环境调节装置可以被配置为蓄水装置。通过控制蓄水装置的电机开启或关闭,可以增加或减少蓄水装置的蓄水量,从而实现对环境数据的调节。在一些实施例中,同一栖息地内可以设置一个或多个环境调节装置130。
在一些实施中,环境调节装置130被配置为基于至少一组环境调节参数调节环境数据。
在一些实施中,处理器140被配置为处理与基于鸟类特征识别的栖息地环境调节系统100有关的信息和/或数据,以执行本申请中描述的一个或以上功能。在一些实施例中,处理器140可以与声纹监测前端设备110、环境监测装置120、环境调节装置130等通信连接,进而获取原始声音数据和环境数据以及传递环境调节参数、设备调动参数等。
在一些实施例中,处理器140可以包括微控制器(Microcontroller,MCU)、嵌入式处理器(Embedded Processor)、图形处理器(Graphics Processing Unit,GPU)等中的一种或多种的组合。
在一些实施例中,处理器140可以被配置为:基于原始声音数据提取声纹数据;基于声纹数据确定多个预设时间段的第一鸟类特征,第一鸟类特征至少包括鸟类物种和对应的鸟类数量;基于多个预设时间段的第一鸟类特征和声纹数据,确定多个预设时间段的第二鸟类特征,第二鸟类特征至少包括种群行为特征以及种群规模;基于环境数据和第二鸟类特征,确定分析结果,分析结果包括至少一个栖息地的环境质量以及至少一个栖息地的设备更新数量和/或设备位置分布;基于分析结果,确定至少一组环境调节参数和至少一组设备调动参数,环境调节参数包括至少一个栖息地的蓄水量,至少一组设备调动参数包括至少一个声纹监测前端设备的设备位置;将至少一组环境调节参数发送至对应的环境调节装置130,将至少一组调动参数发送至对应的声纹监测前端设备110。
在一些实施例中,处理器140还可以被配置为基于环境数据、多个预设时间段的第一鸟类特征和声纹数据,通过鸟类行为模型确定第二鸟类特征,鸟类行为模型为机器学习模型。
在一些实施例中,鸟类行为模型的输出还可以包括第二鸟类特征的置信度,鸟类行为模型可以包括声纹特征提取层和特征确定层。在一些实施例中,声纹特征提取层可以基于环境数据和声纹数据,确定声纹特征;特征确定层可以基于声纹特征和多个预设时间段的第一鸟类特征,确定第二鸟类特征和第二鸟类特征的置信度。
在一些实施例中,分析结果还相关于多个预设时间段的第一鸟类特征。在一些实施例中,处理器140还可以被配置为基于环境数据和多个预设时间段的第一鸟类特征确定预期第二鸟类特征;基于预期第二鸟类特征与第二鸟类特征确定分析结果。
在一些实施例中,基于鸟类特征识别的栖息地环境调节系统100还可以包括模拟鸟叫装置(图中未示出)。
模拟鸟叫装置是用于发出模拟鸟叫的装置。例如,模拟鸟叫装置可以被配置为录音设备、播放设备等具有播放功能的设备。
在一些实施例中,模拟鸟叫装置被配置为基于模拟鸟叫指令进行模拟鸟叫。
在一些实施例中,模拟鸟叫装置可以通过处理器140获取模拟鸟叫指令。
本发明的一些实施例,提供一种基于鸟类特征识别的栖息地环境调节系统,该系统包括至少一个声纹监测前端设备、至少一个环境监测装置、处理器和至少一个环境调节装置。通过该系统实现基于鸟类特征识别的栖息地环境调节方法,可以连续获取数据并传递数据,保证鸟类特征识别的准确性、连续性,并及时对栖息地环境进行调节。通过声纹监测前端设备容易获取声纹数据,通过声纹数据识别鸟类物种,成本较低,对生态环境的侵入性很小,不受障碍物限制,能够扩大生态监测的时空覆盖范围,而且能减小监测人员导致的偏差,从而提高鸟类物种的识别准确性。同时基于环境调节装置还可以对鸟类栖息地的环境特征进行一定的调节,从而维持鸟类种群的数量和多样性。
需要注意的是,以上对于基于鸟类特征识别的栖息地环境调节系统及其模块的描述,仅为描述方便,并不能把本发明限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。在一些实施例中,图1中公开的声纹监测前端设备、环境监测装置、环境调节装置和处理器可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本发明的保护范围之内。
图2是根据本发明一些实施例所示的基于鸟类特征识别的栖息地环境调节方法的示例性流程图。
如图2所示,基于鸟类特征识别的栖息地环境调节方法包括下述步骤210-步骤260。在一些实施例中,步骤210-步骤260可以由基于鸟类特征识别的栖息地环境调节系统100的处理器140执行。
步骤210,基于从声纹监测前端设备获取原始声音数据,提取声纹数据。
原始声音数据是指直接获取的栖息地内的声音数据。例如,原始声音数据可以包括音频等。在一些实施例中,处理器140可以基于声纹监测前端设备110获取原始声音数据。关于声纹监测前端设备110的更多内容可以参见图1及相关说明。
声纹数据是指原始声音数据中的与鸟类有关的声音数据。例如,声纹数据可以包括鸟叫声。
在一些实施例中,处理器140可以基于原始声音数据通过多种方法提取声纹数据。例如,处理器140可以对预处理后原始声音数据进行降噪处理,得到对应的声纹数据。
预处理是预先设置的对原始声音数据的处理方法,例如,删除音频小于预设音频阈值的原始声音数据。又例如,处理器可以将原始声音数据转化为声纹阵列,通过声音聚类算法对声纹阵列进行收敛、聚类得到预处理后的声音数据。声音聚类算法是用于筛除无效声音的算法,例如,VQ聚类算法(Vector Quantization Clustering Algorithm,矢量量化聚类算法)等。无效声音是指除鸟类相关声音外的其他声音。通过预处理,可以初步筛除无效声音,减小后续计算的计算量,从而提高计算效率,节约资源。
降噪处理是指降低或消除原始声音数据中的噪声的处理方法。
在一些实施例中,处理器可以基于预处理后的声音数据,通过语音降噪模型进行降噪得到声纹数据。语音降噪模型可以是机器学习模型,例如,CRUSE(Computer ResourcesUtilization Service Evaluation Model,计算机资源利用服务评估)模型、TaylorSENet模型等。若直接对采集到的原始声音数据提取特征并分类识别,音频所带有的环境因素会对特征产生影响,不能达到期望的效果,通过降噪处理可以提高后续计算的准确度。
步骤220,基于声纹数据确定鸟类声纹模型,基于鸟类声纹模型,确定多个预设时间段的第一鸟类特征,确定多个预设时间段的第一鸟类特征。
预设时间段是预先设置的一段时间。在一些实施例中,处理器140可以按照预设时间梯度进行划分,例如,按照一个小时的预设时间梯度进行划分,得到多个预设时间段为1点-2点、2点-3点、3点-4点……。由于不同鸟类的活跃时间不同,设置多个预设时间段可以使得到的声纹数据更加精准。
第一鸟类特是指与鸟类类别相关的特征,如鸟的类别、体型大小等。在一些实施例中,第一鸟类特征可以包括鸟类物种和各个鸟类物种对应的鸟类数量。
在一些实施例中,处理器140可以基于声纹数据通过多种方法确定第一鸟类特征。例如,处理器140可以将声纹数据按照预设时间梯度进行划分,得到多个预设时间段的声纹数据;对于一个预设时间段的声纹数据,基于该声纹数据从鸟类声纹样本库中进行相似度匹配,选择鸟类声纹样本库中,与该声纹数据的相似度最高的样本声纹数据对应的鸟类声纹模型,作为目标鸟类声纹模型;基于该声纹数据通过目标鸟类声纹模型确定一个预设时间段的第一鸟类特征;以此类推,基于多个预设时间段的声纹数据,重复以上步骤,得到多个预设时间段的第一鸟类特征。鸟类声纹样本库中包括样本鸟类声纹数据和鸟类声纹模型的映射关系。
鸟类声纹模型是基于声纹数据确定第一鸟类特征的模型。在一些实施例中,鸟类声纹模型为机器学习模型,例如,CRNN(Convolutional Recurrent Neural Network,卷积循环神经网络)模型。
在一些实施例中,处理器140可以基于大量训练样本和训练标签通过预设算法训练得到不同的鸟类识别模型。对于某一鸟类物种,可以人工采集该鸟类物种的声纹数据作为训练样本,人工标注对应的鸟类物种作为训练标签。例如,可以将多个带有训练标签的训练样本输入初始鸟类识别模型,通过训练标签和初始鸟类识别模型的结果构建损失函数,基于损失函数通过梯度下降或其他方法迭代更新初始鸟类识别模型的参数。当满足预设条件时模型训练完成,得到训练好的鸟类识别模型。其中,预设条件可以是损失函数收敛、迭代的次数达到阈值等。
在一些实施例中,处理器140可以将声纹数据进行短时傅里叶变换(short timefourier transform, STFT)得到频谱图,将频谱图输入鸟类声纹模型中得到输出的第一鸟类特征。
图3是根据本发明一些实施例所示的鸟类声纹模型的示例性示意图。
在一些实施中,如图3所示,CRNN可以包括卷积层、循环层和全连接层。
卷积层用于提取声纹数据对应的频谱图中的变化特征和频谱信息。关于频谱图参见前文及相关说明。在一些实施例中,卷积层可以是机器学习模型,如CNN(ConvolutionalNeural Networks,卷积神经网络)模型。卷积层通过训练特征核(feature kernel)以提取输入频谱图中的变化特征;经过卷积操作(如滤波和降维)后,卷积层输出不同特征核强化后的特征图;下一层卷积层以该特征图作为输入,训练新的特征核,从而提取更深层次的变化特征。经过多层处理,CNN可以输出较大范围的变化特征图。通过多层卷积运算后,原始特征图被转化为多个一维的子特征图,为了保证卷积层输出与训练标签相对应,卷积层仅对频域进行压缩,因此可以将多个一维的子特征图在频域上进行堆叠拼接,输出一张新的特征图,并将新的特征图作为循环层的输入。
循环层用于捕捉音频信号在时间上的变化和动态特性。在一些实施例中,循环层可以是机器学习模型,如RNN(Recurrent Neural Network,循环神经网络)模型。通过循环层,CRNN网络可以建模音频信号的时序依赖关系。循环层的循环结构允许处理器在处理音频信号时保留先前的状态信息,从而捕捉音频信号在时间上的变化和动态特性。循环层采用GRU结构,循环层可以检测出新的特征图中的长时序规律,并输出相同长度的检测序列。经过循环层之后,已经学习到了长时域特征,因此可以将检测序列进行帧化,即将一段检出序列切分成多帧输出特征。
全连接层用于确定第一鸟类特征。在一些实施例中,全连接层可以是机器学习模型,如深度神经网络(Deep Neural Networks,DNN)模型、神经网络(Neural Networks,NN)模型等。全连接层可以对每一帧的输出进行判定,如对多帧局部音频特征和频谱信息进一步统计,推算出该鸟类物种对应的鸟类数量在时间、空间上的分布与变化,将通过中值滤波进行平滑得到最终的结果输出为第一鸟类特征。
CRNN结合了CNN和RNN的优势,能够对时域和频域信息进行有效地建模和处理,具有长时域音频结构的学习能力,在音频事件检测领域有很好的效果。RNN的循环结构允许网络在处理音频序列时保留先前的状态信息,从而捕捉到音频在时间上的变化和动态特性。
为提高第一鸟类特征的识别准确率,可以对鸟类声纹样本库进行更新。在一些实施例中,处理器可以基于多种方法更新鸟类声纹样本库。
例如,处理器140可以将鸟类声纹模型输出的第一鸟类特征录入到鸟类声纹样本库中,此外,让领域内专业人员对识别结果进行识别和校验,对声纹识别结果的准确率进行重新评估,并根据专业人员意见,进行鸟类声纹模型的再训练,训练结果经过测试验证后,更新至鸟类声纹样本库。初始鸟类声纹样本库包含优质的公开鸟类声音数据和自采鸟类声音数据,声纹监测前端设备自动采集的优质鸟类声音数据在专业人员核实后,将不断丰富到样本库中;当识别特定类型的声纹数据存在问题时,人工确认该声纹数据的正确分类,并添加到鸟类声纹模型的训练数据集。
在一些实施例中,处理器140可以对存入可供分析和处理的原始声音数据进行梳理和归类,详细规定存储的数据类型、采集频率、数据来源和数据类别。让存储的数据可以为下一步的数据应用与展示提供数据支撑。该数据标准应包含唯一的、标准的、适用于智能监测设备的数据格式。
在一些实施中,处理器140可以继续收集鸟类的鸣声数据,扩充鸟类声纹样本库,不断验证更新鸟类声纹特征识别参数。随着数据集的增加,模型的泛化能力会不断增强,识别准确率也会不断提高。
与现有的CRNN模型相比,本发明一些实例提供的鸟类声纹模型可以将将深度卷积循环神经网络与声纹监测前端设备相结合,收集大量的鸟类声音数据进行处理,对鸟鸣声进行特征提取,识别与检测目标物种,可以实现对鸟类物种的动态监测。将音频转化为频谱图,将图片识别算法应用于声音的识别,可以实现对鸟鸣声音频信号的变化特征和频谱信息进行分析,从而提高对鸟类物种识别的精确度。同时不断对鸟类声纹模型进行更新,可以提高模型的稳定性和可靠性。
以上所述仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。
步骤230,基于多个预设时间段的第一鸟类特征和声纹数据,确定第二鸟类特征。
第二鸟类特征是指与鸟类种群相关的特征。在一些实施例中,第二鸟类特征可以包括种群行为特征以及种群规模。种群行为特征是反映鸟类种群行为的特征,例如,某一鸟类物种在栖息地中的活动(如飞行、觅食等)频率。种群规模是某一鸟类物种在某一栖息地中的数量。
在一些实施例中,处理器140可以基于多个预设时间段的第一鸟类特征和声纹数据,通过多种方法确定第二鸟类特征。例如,处理器140可以基于多个预设时间段的第一鸟类特征和声纹数据,确定种群行为特征。例如,处理器140可以将声纹数据中某一鸟类物种在预设时间区间的平均出现频率,确定为该鸟类物种的活动频率。示例性的,统计到某一鸟类物种在一月内出现了240次,则该鸟类物种的活动频率为8次/天。
又例如,处理器140可以计算预设时间区间内多个预设时间段的某一鸟类物种的鸟类数量的平均值,将该平均值作为种群规模。示例性的,某一鸟类物种的在一天中的每个小时的鸟类数量的平均值为320,则该鸟类的种群规模为320只。
又例如,处理器140可以基于多个预设时间段的第一鸟类特征和声纹数据,确定物种比例。物种比例是指同一鸟类物种的鸟类中雌鸟与雄鸟的比例。处理器140可以基于同一鸟类物种对应的声纹数据的相似度,确定该鸟类物种的辨识度;基于该鸟类物种辨识度查找预设表格确定该鸟类物种的物种比例。辨识度是指不同性别的鸟类叫声的区分容易程度,可以用等级或分数表示。预设表格中包含辨识度与物种比例的映射关系。辨识度与物种比例正相关,辨识度越低,物种比例越接近于1:1。辨识度与物种比例的映射关系可以人工确定。
在一些实施例中,处理器140还可以基于第一鸟类特征、声纹数据和环境数据,通过鸟类行为模型确定第二鸟类特征,具体内容可以参见图4及相关说明。
步骤240,基于从环境监测装置获取的环境数据和第二鸟类特征,确定分析结果。
环境数据是指栖息地内的环境相关数据,例如,温度、湿度等。在一些实施例中,处理器140可以基于环境监测装置120获取环境数据。关于环境监测装置120的更多内容可以参见图1及相关说明。
分析结果是指对鸟类栖息地相关数据的分析结果。在一些实施例中,分析结果包括至少一个栖息地的环境质量以及至少一个栖息地的设备更新数量和/或设备位置分布。
环境质量是用于评估栖息地的环境对于鸟类生存的影响的数据,环境质量可以用等级或分数表示。设备更新数量是指声纹监测前端设备更新后的数量,设备位置分布是指声纹监测前端设备更新后的位置分布情况。
在一些实施例中,处理器140可以基于环境数据和第二鸟类特征,通过多种方法确定分析结果。例如,处理器140可以基于环境数据和第二鸟类特征构建特征向量,基于特征向量在第一向量数据库中查找与特征向量的向量距离最小的参考向量,将参考向量对应的参考分析结果作为分析结果。第一向量数据库中包括多个参考向量及其对应的参考分析结果。
处理器140可以基于历史数据中的历史环境数据、历史第二鸟类特征、历史分析结果进行聚类,将聚类形成的聚类中心对应的历史环境数据、历史第二鸟类特征确定为参考向量,聚类中心对应的历史分析结果作为参考分析结果。历史分析结果包括至少一个栖息地的历史环境质量以及至少一个栖息地的历史设备更新数量和/或历史设备位置分布。
在一些实施例中,处理器140还可以基于环境数据和多个预设时间段的第一鸟类特征确定预期第二鸟类特征;基于预期第二鸟类特征与第二鸟类特征确定分析结果。关于上述实施例的更多内容可以参见图5及相关说明。
步骤250,基于分析结果,确定至少一组环境调节参数和至少一组设备调动参数。
环境调节参数是指对栖息地环境中的蓄水量、温度等进行调节的参数。在一些实施例中,环境调节参数包括至少一个栖息地的蓄水量。
设备调动参数是指对特定位置的声纹监测设备进行开启和关闭的参数。在一些实施例中,设备调动参数包括至少一个声纹监测前端设备的设备位置。
在一些实施例中,处理器140可以基于至少一个栖息地的环境质量小于预设质量阈值,确定至少一组环境调节参数和至少一组设备调动参数。例如,处理器140可以基于环境质量从预设表格查找对应的环境调节参数。预设表格包括环境质量与环境调节参数的映射关系。预设表格可以基于历史数据构建。
又例如,处理器140可以将分析结果发送至用户终端。用户终端可以是手机终端、平板电脑、计算机等,用户可以包括基于鸟类特征识别的栖息地环境调节系统的管理人员等。用户可以基于用户终端确定至少一组环境调节参数和至少一组设备调动参数。
步骤260,将至少一组环境调节参数发送至对应的环境调节装置,将至少一组设备调动参数发送至对应的声纹监测前端设备。
在一些实施例中,处理器140可以将至少一组环境调节参数发送至对应的环境调节装置130;将至少一组设备调动参数发送至对应的声纹监测前端设备110。
在一些实施例中,环境调节装置130可以基于至少一组环境调节参数调节环境数据。例如,环境调节装置130可以通过控制蓄水装置的电机开启,增加蓄水装置的蓄水量直至实际蓄水量达到环境调节参数中的目标蓄水量。
在一些实施中,声纹监测前端设备110可以基于至少一组设备调动参数对需要调节的声纹监测前端设备进行开启或关闭。
本发明的一些实施例可能带来的有益效果包括但不限于:(1)实现原始声音数据的连续采集和远距离传输;(2)对原始声音数据进行预处理可以滤除背景噪声和无鸟叫的部分数据,减少后续计算量,满足声纹识别使用需求;(3)基于声纹数据确定多个预设时间段的第一鸟类特征,可以用于对不同时间段的鸟类叫声进行识别,可以扩大适用场景,提高后续对鸟类物种进行识别的准确性;(4)基于环境数据和第二鸟类特征对鸟类栖息地进行分析,可以判断人类活动是否对环境造成影响,从而进一步结合环境调节装实现对环境数据的调节,从而使环境更利于鸟类物种的生存,对维持栖息地鸟类种群的数量、多样性有重要意义;(5)基于分析结果,还可以对栖息地中获取原始数据的声纹监测前端设备的数量和工作设备的分布位置进行调节,从而提高数据获取的准确性,有利于后续判定鸟类物种更加精准。
应当注意的是,上述有关步骤210-步骤260的描述仅仅是为了示例和说明,而不限定本发明的适用范围。对于本领域技术人员来说,在本发明的指导下可以对步骤210-步骤260进行各种修正和改变。然而,这些修正和改变仍在本发明的范围之内。
图4是根据本发明一些实施例所示的通过鸟类行为模型确定第二鸟类特征的示例性示意图。
在一些实施例中,如图4所示,处理器140可以基于环境数据、多个预设时间段的第一鸟类特征和声纹数据,通过鸟类行为模型确定第二鸟类特征。
在一些实施例中,鸟类行为模型为机器学习模型,例如,深度神经网络(DeepNeural Networks,DNN)模型、神经网络(Neural Networks,NN)模型等中的一种或多种的组合。
在一些实施例中,鸟类行为模型可以通过大量第三训练样本和第一标签通过以下步骤训练得到:将多个带有第一标签的第三训练样本输入初始鸟类行为模型,通过第一标签和初始鸟类行为模型的结果构建损失函数,基于损失函数通过梯度下降或其他方法迭代更新初始鸟类行为模型的参数。当满足预设条件时模型训练完成,得到训练好的鸟类行为模型。其中,预设条件可以是损失函数收敛、迭代的次数达到阈值等。
第三训练样本中的每组训练样本可以包括样本数据中的样本环境数据、多个时间区间的样本第一鸟类特征。第三训练样本可以通过历史数据获取。第一标签为每组第三训练样本对应的实际第二鸟类特征。第一标签可以基于人工测量的物种数据和/或图像采集设备精确采集得到的物种数据进行统计,得到第二鸟类特征作为实际第二鸟类特征。
在一些实施例中,鸟类行为模型的输出还包括第二鸟类特征的置信度。
第二鸟类特征的置信度反映鸟类行为模型输出的第二鸟类特征的真实度。置信度越高,鸟类行为模型输出的第二鸟类特征越接近实际第二鸟类特征。
在一些实施例中,鸟类行为模型包括声纹特征提取层和特征确定层。
声纹特征提取层是用于确定声纹特征的模型。声纹特征提取层可以基于环境数据和声纹数据,确定声纹特征。声纹特征是指声纹数据的音频特征,如频谱特征、时域特征等。
在一些实施例中,声纹特征提取层为机器学习模型,例如,深度神经网络(DeepNeural Networks,DNN)模型、神经网络(Neural Networks,NN)模型等中的一种或多种的组合。
特征确定层是用于确定第二鸟类特征和第二鸟类特征的置信度的模型。特征确定层可以基于声纹特征和多个预设时间段的第一鸟类特征,确定第二鸟类特征和第二鸟类特征的置信度。
在一些实施例中,特征确定层为机器学习模型,例如,深度神经网络(Deep NeuralNetworks,DNN)模型、神经网络(Neural Networks,NN)模型等中的一种或多种的组合。
在一些实施例中,声纹特征提取层和特征确定层可以通过联合训练得到。训练过程参见后文相关说明。
本发明的一些实施例,通过鸟类行为模型的声纹特征提取层和特征确定层,确定第二鸟类特征和第二鸟类特征的置信度,采用多层模型和增加模型的输入,可以提高模型的可靠性。同时模型输出增加了第二鸟类特征的置信度,可以更好的对模型的准确度进行评估,从而便于对模型进行优化。
在一些实施例中,声纹数据包括补充声纹数据。
补充声纹数据是指基于原始声音数据,提取声纹数据的数据量不足,而补充添加的声纹数据。
在一些实施例中,处理器140可以响应于声纹数据的数据量小于预设阈值,通过模拟鸟叫装置进行模拟鸟叫,从声纹监测前端设备获取进行模拟鸟叫后的预设时间段内的声音数据作为扩充原始数据;基于扩充原始数据,确定补充声纹数据。
模拟鸟叫是指声音数据与鸟类叫声相同或相似的声音。模拟鸟叫可以包括不同鸟类物种表达同一个信息的不同叫声,同一鸟类物种表达不同信息的叫声等,例如,布谷鸟的归巢叫声,喜鹊的觅食叫声等。
在一些实施例中,模拟鸟叫可以以录音的形式存储在模拟鸟叫装置中,处理器140可以响应于声纹数据的数据量小于预设阈值,通过模拟鸟叫装置播放预设录音。预设录音可以包括预先录制的多种鸟叫声。
在一些实施例中,处理器140可以基于多个预设时间段的第一鸟类特征通过预设算法确定模拟鸟叫指令,基于模拟鸟叫指令通过模拟鸟叫装置进行模拟鸟叫。
模拟鸟叫指令是指示模拟鸟叫装置播放模拟鸟叫的指令信息。
预设算法是预先设置的确定模拟鸟叫指令的算法程序。在一些实施例中,预设算法可以包括:构建模拟鸟叫数据库;基于第一鸟类特征,查找模拟鸟叫数据库确定候选模拟鸟叫;基于第一鸟类特征、第二鸟类特征、候选模拟鸟叫确定鸟类习性,基于鸟类习性,确定播放模拟鸟叫的播放时间区间以及目标模拟鸟叫;基于栖息地占地面积以及林木覆盖率,确定模拟鸟叫的声音强度,基于第一鸟类特征确定模拟鸟叫的播放频率;基于播放时间区间、目标模拟鸟叫、声音强度、播放频率等生成模拟鸟叫指令。
模拟鸟叫数据库包括大量模拟鸟叫。在一些实施例中,处理器140可以基于初始模拟鸟叫数据库,确定信息独特性和信息区分度;基于信息独特性和信息区分度确定第一权重;基于初始模拟鸟叫数据库和第一权重确定候选鸟类叫声,基于候选鸟类叫声构建模拟叫声数据库。
初始模拟鸟叫数据库包括优质的公开鸟类叫声和自采鸟类叫声。初始模拟鸟叫数据库中的鸟类叫声可以包括不同的年龄、不同性别的鸟在不同环境中的鸟产生的不同鸟叫。即,在初始模拟鸟叫数据库中,一种鸟类传达一种信息可能对应多个鸟类叫声。可以理解的是,同种鸟类传达的相同信息,在不同的年龄、环境情况下,传达信息的重要程度可能不同。例如,在一些社会性比较分明的鸟类里,有的鸟的号召力会强一些,传达的信息的重要程度就高一些。
信息独特性用于反映某一个鸟类叫声在该鸟类群体中的独特程度。在一些实施例中,对某一种鸟类的某一种鸟类叫声,处理器140可以基于初始模拟鸟叫数据库已采集的数据中,该种鸟类叫声的出现次数和该种鸟类的叫声出现总次数,确定该种鸟类叫声的信息独特性。例如,处理器140可以基于公式(1)确定信息独特性。公式(1)如下所示:
其中,P表示信息独特性。n表示某一种鸟类的某一种鸟类叫声出现的次数,j表示鸟类物种,i表示鸟类叫声传达的信息,表示鸟类j的传达信息i的鸟类叫声出现的次数,如鸟类j传达归巢信息的鸟类叫声出现的次数。k为鸟类j传达的信息种类,/>表示初始模拟鸟叫数据库中鸟类j的叫声出现总次数。
信息区分度用于衡量某一个鸟类叫声在所有鸟类叫声中的区分能力。在一些实施例中,对某一种鸟类的某一种鸟类叫声,处理器140可以基于初始模拟鸟叫数据库中的总数据量和该种鸟类的叫声出现总次数,确定该种鸟类叫声的信息区分度。例如,处理器140可以基于公式(2)确定信息区分度。公式(2)如下所示:
其中,D表示信息区分度;M表示初始模拟鸟叫数据库中所有鸟类叫声的总数据量,j表示鸟类物种,i表示鸟类叫声传达的信息。dj表示鸟类j的叫声出现总次数,ti表示鸟类信息i的出现次数,|表示包含鸟类信息i的鸟类叫声在鸟类j的所有鸟类叫声中的出现次数。
第一权重是某一个鸟类叫声在初始模拟鸟叫数据库中的权重,可以反映该鸟类叫声的重要程度。在一些实施例中,处理器140可以基于该鸟类叫声的信息独特性和信息区分度,确定第一权重。例如,通过公式(3)确定,公式(3)如下所示:
第一权重=信息独特性×信息区分度 (3)
在一些实施例中,处理器140可以比较该鸟类传达某种信息的所有鸟类叫声中,每一个传达该信息的鸟类叫声对应的第一权重,将第一权重最高的鸟类叫声作为该种鸟类传达该信息的候选模拟鸟叫;以此类推,筛选出不同鸟类传达不同信息的候选模拟鸟叫,并构建模拟鸟叫数据库。即,模拟鸟叫数据库中,一种鸟类的一种信息对应一个鸟类叫声。
通过上述方法构建模拟鸟叫数据库,可以使模拟鸟叫数据库中收录的模拟鸟叫具有较高的重要程度,从而使通过播放模拟鸟叫,可以获得更多的补充声纹数据。
在一些实施例中,处理器140可以基于第一鸟类特征查找模拟鸟叫数据库,确定第一鸟类特征中的至少一种鸟类物种对应的至少一个候选模拟鸟叫。模拟鸟叫数据库预先存储了多个鸟类物种的叫声以及同一物种的鸟类传递不同信息的叫声。示例性的,第一鸟类特征是布谷鸟,则将模拟鸟叫数据库中所有与布谷鸟有关的叫声,如布谷鸟的归巢叫声、布谷鸟的觅食叫声等作为候选模拟鸟叫。
鸟类习性是指鸟类的饮食作息等自然规律,例如,傍晚归巢、半夜觅食等。在一些实施例中,处理器140可以基于鸟类习性,通过多种方法确定播放模拟鸟叫的播放时间区间以及目标模拟鸟叫。
例如,某一鸟类物种的鸟类习性为傍晚归巢,则处理器140可以将播放模拟鸟叫的播放时间区间设置为傍晚时间段(如17点-19点);同时,将该鸟类对应的具有归巢标签的模拟候选模拟鸟叫确定为目标模拟鸟叫。又例如,某一鸟类物种鸟类习性为半夜觅食,则处理器140可以将播放模拟鸟叫的播放时间区间设置为半夜时间段(如21点-23点);同时,将该鸟类对应的具有觅食标签的候选模拟鸟叫确定为目标模拟鸟叫。
在一些实施例中,处理器140可以基于栖息地占地面积以及林木覆盖率,通过多种方法确定,确定模拟鸟叫的声音强度。
声音强度可以与栖息地占地面积以及林木覆盖率正相关。示例性的,处理器140可以基于栖息地占地面积以及林木覆盖率通过公式(4)计算得到声音强度。公式(4)如下所示:
声音强度=w1×栖息地占地面积×第一标准强度/标准占地面积+w2×林木覆盖率×第二标准强度/标准林木覆盖率 (4)
其中,w1、w2是大于0的系数;标准占地面积和标准林木覆盖率是指第一鸟类特征下的鸟类正常生存所需的栖息地占地面积和林木覆盖率;第一标准强度、第二标准强度是分别指在标准占地面积、标准林木覆盖率的环境下声音能够清晰播放需要的声音强度。标准占地面积、标准林木覆盖率、第一标准强度和第二标准强度可以人工根据经验设置。
在一些实施例中,处理器140可以基于第一鸟类特征查找预设表格确定模拟鸟叫的播放频率。预设表格包含第一鸟类特征与模拟鸟叫的播放频率的映射关系。预设表格的播放频率是使得鸟类产生更多真实回应的模拟鸟叫对应的播放频率,预设表格可以人工构建。
在一些实施例中,处理器140可以基于模拟鸟叫指令通过模拟鸟叫装置,按照模拟鸟叫指令对应的播放时间区间、声音强度、播放频率,播放模拟鸟叫。
本发明的一些实施例,通过预设算法确定模拟鸟叫指令,考虑到了鸟类习性、林木覆盖率、栖息地占地面积等多种因素对播放模拟鸟叫造成的影响,从而更加精准的计算出匹配的模拟鸟叫和播放模拟鸟叫的参数,从而使获取的补充声纹数据更加丰富和准确。
扩充原始数据是指播放模拟鸟叫后预设时间段内的声音数据。预设时间段可以人工设置,例如,播放模拟鸟叫后的3小时。
在一些实施例中,处理器140可以基于扩充原始数据,通过确定声纹数据的类似方法,确定候选补充声纹数据;筛除候选补充声纹数据中模拟鸟叫对应的声纹数据,得到补充声纹数据。关于确定声纹数据的细节可以参见图2及相关说明。
本发明的一些实施例,通过模拟鸟叫装置进行模拟鸟叫,从声纹监测前端设备获取进行所述模拟鸟叫后的预设时间段内的鸟叫数据作为扩充原始数据。可以解决声纹数据的数据量不足的问题,为后续鸟类行为模型提供足够的样本量,从而提高模型的可靠性。
在一些实施例中,鸟类行为模型的训练至少包括第一阶段训练。第一阶段训练的第一训练样本包括预设比例的第一类数据、第二类数据。
在一些实施例中,第一类数据包括环境数据、多个预设历史时间段的第一鸟类特征、声纹数据。在一些实施例中,第二类数据包括环境数据、多个预设历史时间段的第一鸟类特征、补充声纹数据。第一类数据和第二类数据可以从历史数据库中随机抽取。历史数据库包括历史数据中的环境数据、多个预设历史时间段的第一鸟类特征、声纹数据、补充声纹数据等。
在一些实施例中,鸟类行为模型的声纹特征提取层和特征确定层可以基于第一训练样本通过联合训练得到。将第一训练样本中的第一类数据的环境数据和声纹数据,以及第二类数据中的环境数据和补充声纹数据,分别输入声纹特征提取层,得到声纹特征提取层输出的声纹特征;将声纹特征和第一训练样本中的对应的多个预设时间段的第一鸟类特征,输入特征确定层,得到特征确定层输出的第二鸟类特征和第二鸟类特征的置信度。
在一些实施例中,处理器140可以基于实际第二鸟类特征、第二鸟类特征的实际置信度以及声纹特征提取层输出的声纹特征构建损失函数,并同步更新声纹特征提取层和特征确定层的参数。通过参数更新,得到训练好的声纹特征提取层和特征确定层。
本发明的一些实施例,通过第一类数据、第二类数据对鸟类行为模型进行训练,可以增加模型训练的样本数量,提高训练得到的鸟类行为模型的可靠性与准确性。
在一些实施例中,鸟类行为模型的训练包括第二阶段训练。第二阶段训练在第一阶段训练完成后执行。在一些实施例中,第二阶段训练的第二训练样本包括第三类数据、第四类数据、第五类数据。
在一些实施例中,第三类数据包括第一训练阶段中对第二鸟类特征识别错误时对应的环境数据、多个预设时间段的第一鸟类特征和声纹数据。第四类数据包括第一训练阶段中对第二鸟类特征识别正确时对应的环境数据、多个预设时间段的第一鸟类特征和声纹数据;第五类数据包括对第一训练阶段中对第二鸟类特征识别正确时对应的环境数据、多个预设时间段的第一鸟类特征和处理后声纹数据,处理后声纹数据是指对第一训练阶段中对第二鸟类特征识别正确时对应的声纹数据进行噪声处理后得到的数据。
噪声处理是指在声音数据中添加噪声的处理方式。噪声可以包括椒盐噪声、高斯噪声、泊松噪声。在一些实施例中,噪声处理时可以应用一个或多个噪声。
在一些实施例中,鸟类行为模型的声纹特征提取层和特征确定层可以基于第二训练样本中,按照预设比例或随机混合的第三类数据、第四类数据、第五类数据,通过联合训练得到。具体训练方法与第一训练阶段类似,参见前文的说明。
本发明的一些实施例,通过在第二训练阶段主动加入噪声,可以防止数据过拟合,提高模型的使用范围。
本发明的一些实施例,通过鸟类行为模型确定第二鸟类特征,可以在节省资源、提高识别效率的同时,确定合理的第二鸟类特征。从而使后续确定的分析结果更加准确,使对栖息地的调节更加符合实际情况。
图5是根据本发明一些实施例所示的确定分析结果的示例性示意图。
在一些实施例中,分析结果还相关于第一鸟类特征。
在一些实施例中,如图5所示,处理器140可以基于环境数据和多个预设时间段的第一鸟类特征确定预期第二鸟类特征;基于预期第二鸟类特征与第二鸟类特征确定预期第二鸟类特征与第二鸟类特征的符合程度;基于符合程度确定分析结果。
预期第二鸟类特征反映实际栖息地中第二鸟类特征的预估值。例如,大雁冬季在南方栖息地应该有较高的预估种群规模。
在一些实施例中,处理器140可以基于环境数据和多个预设时间段的第一鸟类特征查找预设表格确定预期第二鸟类特征。预设表格包含环境数据和多个预设时间段的第一鸟类特征与预期第二鸟类特征。预设表格可以基于人工评估的结果构建。例如,用户评估栖息地A的某一鸟类是从栖息地B迁徙来的,那么该鸟类在栖息地A的种群规模和种群比例,应该和该鸟类在栖息地B的种群规模和种群比例相同。
在一些实施例中,预期第二鸟类特征还相关于环境差异值。
环境差异值是衡量实际环境和理论环境的差距的值。示例性的,某栖息地理论上生活的白鹳是200只,但是由于栖息地环境变化,如降雨量增加导致蓄水量增加,则实际上生活的白鹳数量可能也会增加。
在不同的地理环境中,第二鸟类特征也有可能不同。例如,对于同样的25℃的湿地,位于南方的湿地和位于北方的湿地容纳的种群规模及种群行为特征很有可能存在差异。又例如,对于大雁等候鸟,就算秋冬季节将北方栖息地人工将温度停留在25℃,栖息地里面的大雁数量和南方也是有差距的。
在一些实施例中,处理器140可以基于鸟类生存数据生成待匹配向量;基于待匹配向量,通过向量数据库确定环境差异值;基于环境数据、第一鸟类特征和环境差异值确定预期第二鸟类特征。
鸟类生存数据是指鸟类生存所需的栖息地的地理环境数据。在一些实施例中,鸟类生存数据可以包括栖息地区域、栖息地季节、栖息地气候等。
待匹配向量是表示等待匹配的一个或多个鸟类生存数据构成的一组特征值。待匹配向量反应鸟类当前所在栖息地的环境和气候特征。在一些实施例中,处理器140可以基于栖息地区域、栖息地季节、栖息地气候中的至少一种生成待匹配向量。
向量数据库包括多个参考向量和对应的参考环境差异值。在一些实施例中,处理器140可以基于历史数据中的历史栖息地区域、历史栖息地季节、历史栖息地气候、历史环境差异值进行聚类,将聚类形成的聚类中心对应的历史栖息地区域、历史栖息地季节、历史栖息地气候确定为参考向量,聚类中心对应的历史环境差异值作为参考环境差异值。
在一些实施例中,处理器140可以基于待匹配向量在向量数据库中进行匹配,选择与待匹配向量相似度最高的参考向量对应的参考环境差异值作为目标环境差异值。相似度与待匹配向量和参考向量的向量距离成反比,向量距离可以为余弦距离或欧氏距离等。
在一些实施例中,处理器140可以基于鸟类行为模型确定的第二鸟类特征,以及向量数据库匹配的目标环境差异值,确定预期第二鸟类特征。预期第二鸟类特征可以与第二鸟类特征、目标环境差异值正相关。例如,处理器140可以通过公式(5)计算得到预期第二鸟类特征,公式(5)如下所示:
预期第二鸟类特征=第二鸟类特征×环境差异值 (5)
本发明的一些实施例,基于鸟类生存数据和环境差异值确定第二鸟类特征,能够从数据层面上评估鸟类当前生存的栖息地和理想栖息地之间的差距,获得更贴合实际的、更合理的预期第二鸟类特征。
在一些实施例中,向量数据库可以进行周期性更新。
在一些实施例中,处理器140可以基于环境数据、多个预设时间段的第一鸟类特征、声纹数据通过鸟类行为模型确定第二鸟类特征;响应于第二鸟类特征和预期第二鸟类特征相似度小于预设阈值,基于第二鸟类特征调整环境差异值,并更新向量数据库。
关于通过鸟类行为模型确定第二鸟类特征的细节可以参见图4及相关说明。
在一些实施例中,处理器140可以基于第二鸟类特征确定种群活跃度,基于种群活跃度调整环境差异值。
种群活跃度用于反映鸟类种群活动的频繁程度。在一些实施中,种群活跃度与第二鸟类特征中的种群行为特征和种群规模相关。
例如,处理器可以基于公式(6)计算得到种群活跃度,公式(6)如下所示:
种群活跃度=k1×cos(种群行为特征,预期种群行为特征)+k2×种群规模/预期种群规模 (6)
其中,k1、k2是大于0的系数,可以人工根据经验确定;种群行为特征和种群规模的确定方法可以参见图2及相关说明;预期种群行为特征、预期种群规模可以人工基于栖息地实际情况提前预设。
在一些实施例中,响应于种群活跃度低于或等于预设活跃度阈值,将环境差异值调低;响应于种群活跃度高于预设活跃度阈值,将环境差异值调高。调整幅度可以人工根据经验设置。在一些实施例中,处理器140可以将调整后的环境差异值作为新的参考环境差异值,更新到向量数据库中。
本发明的一些实施例,通过对向量数据库进行周期性更新,可以使向量数据库中收录的数据更加符合鸟类的实际活动情况,从而获得更准确的环境差异值。
符合程度是指通过鸟类行为模型确定的第二鸟类特征,与预期第二鸟类特征符合的程度。在一些实施例中,预期第二鸟类特征包括预期种群规模和预期种群比例中的至少一种。预期群规模是鸟类在栖息地中实际的种群规模预估值。预期种群比例是指鸟类在栖息地中实际的种群比例的预估值。预期种群规模和预期种群比例符合鸟类的生活习性,例如,大雁冬天在南方候鸟迁徙地的预期种群规模较高。
在一些实施例中,处理器140可以基于多种方法确定预期第二鸟类特征和第二鸟类特征的符合程度。例如,处理器140可以分别基于预期第二鸟类特征构建第一向量,基于第二鸟类特征构建第二向量;计算第一向量和第二向量的相似度,将相似度作为符合程度。第二鸟类特征包括群规模和种群比例中的至少一种。相似度与第一向量和第二向量的向量距离成反比,向量距离可以是余弦距离或欧式距离等。
在一些实施例中,处理器140可以基于符合程度通过多种方法确定分析结果。例如,响应于符合程度小于或等于第一阈值,说明声纹监测前端设备可能存在获取的数据量不足的问题,处理器140可以生成增加的声纹监测前端设备的数量和对应的位置。
例如,响应于符合程度大于第一阈值且小于第二阈值,说明栖息地可能存在环境问题,处理器140可以生成栖息地的环境质量。第二阈值大于第一阈值。
在一些实施例中,栖息地的环境质量与符合程度正相关。例如,处理器140可以基于符合程度通过公式(7)计算得到栖息地的环境质量。公式(7)如下所示:
栖息地的环境质量=符合程度×m(7)
其中,m为大于0的系数,m的值可以人工根据经验设置。
本发明的一些实施例,基于环境数据和多个预设时间段的第一鸟类特征确定预期第二鸟类特征,基于预期第二鸟类特征与第二鸟类特征确定分析结果。该方法可以通过对栖息地实际环境进行评估得到预期第二鸟类特征,分析鸟类行为模型输出的第二鸟类特征与预期第二鸟类特征的差异,基于差异的大小对分析结果进行相应的调整,从而提高分析结果的准确性。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细公开仅仅作为示例,而并不构成对本发明的限定。虽然此处并没有明确说明,本领域技术人员可能会对本发明进行各种修改、改进和修正。该类修改、改进和修正在本发明中被建议,所以该类修改、改进、修正仍属于本发明示范实施例的精神和范围。
同时,本发明使用了特定词语来描述本发明的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本发明至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本发明中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本发明的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,除非权利要求中明确说明,本发明所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本发明流程和方法的顺序。尽管上述公开中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于公开的实施例,相反,权利要求旨在覆盖所有符合本发明实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本发明公开的表述,从而帮助对一个或多个发明实施例的理解,前文对本发明实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种公开方法并不意味着本发明对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述公开的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,本申请中中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本发明一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本发明引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本发明作为参考。与本发明内容不一致或产生冲突的申请历史文件除外,对本发明权利要求最广范围有限制的文件(当前或之后附加于本发明中的)也除外。需要说明的是,如果本发明附属材料中的描述、定义、和/或术语的使用与本发明所述内容有不一致或冲突的地方,以本发明的描述、定义和/或术语的使用为准。
最后,应当理解的是,本发明中所述实施例仅用以说明本发明实施例的原则。其他的变形也可能属于本发明的范围。因此,作为示例而非限制,本发明实施例的替代配置可视为与本发明的教导一致。相应地,本发明的实施例不仅限于本发明明确介绍和描述的实施例。

Claims (10)

1.一种基于鸟类特征识别的栖息地环境调节方法,其特征在于,所述方法通过基于鸟类特征识别的栖息地环境调节系统实现,所述系统包括至少一个声纹监测前端设备、至少一个环境监测装置、处理器和至少一个环境调节装置,所述方法基于处理器执行,所述方法包括:
基于从声纹监测前端设备获取的原始声音数据,提取声纹数据;
基于所述声纹数据确定鸟类声纹模型,基于所述鸟类声纹模型确定多个预设时间段的第一鸟类特征,所述第一鸟类特征包括鸟类物种和各个所述鸟类物种对应的鸟类数量,所述鸟类声纹模型为深度卷积循环神经网络模型;
基于所述多个预设时间段的所述第一鸟类特征和所述声纹数据,确定第二鸟类特征,所述第二鸟类特征包括种群行为特征以及种群规模;
基于从环境监测装置获取的环境数据和所述第二鸟类特征,确定分析结果,所述分析结果包括至少一个栖息地的环境质量以及所述至少一个栖息地的设备更新数量和/或设备位置分布;
基于所述分析结果,确定至少一组环境调节参数和至少一组设备调动参数,所述环境调节参数包括所述至少一个栖息地的蓄水量,所述至少一组设备调动参数包括至少一个声纹监测前端设备的设备位置;
将所述至少一组环境调节参数发送至对应的环境调节装置,将所述至少一组设备调动参数发送至对应的声纹监测前端设备。
2.如权利要求1所述方法,其特征在于,所述基于所述多个预设时间段的所述第一鸟类特征和所述声纹数据,确定第二鸟类特征包括:
基于所述环境数据、所述多个预设时间段的所述第一鸟类特征和所述声纹数据,通过鸟类行为模型确定所述第二鸟类特征,所述鸟类行为模型为深度神经网络DNN模型、神经网络NN模型中的至少一种。
3.如权利要求2所述方法,其特征在于,所述鸟类行为模型的输出还包括所述第二鸟类特征的置信度,所述鸟类行为模型包括声纹特征提取层和特征确定层;
所述声纹特征提取层基于所述环境数据和所述声纹数据,确定声纹特征;所述特征确定层基于所述声纹特征和所述多个预设时间段的所述第一鸟类特征,确定所述第二鸟类特征和所述第二鸟类特征的所述置信度。
4.如权利要求3所述方法,其特征在于,所述声纹数据还包括补充声纹数据,所述方法进一步包括:
响应于所述声纹数据的数据量小于预设阈值,通过模拟鸟叫装置进行模拟鸟叫,从声纹监测前端设备获取进行所述模拟鸟叫后的预设时间段内的声音数据,作为扩充原始数据;
基于所述扩充原始数据,确定所述补充声纹数据。
5.如权利要求1所述方法,其特征在于,所述基于从环境监测装置获取的环境数据和所述第二鸟类特征,确定分析结果还包括:
基于所述环境数据和所述多个预设时间段的所述第一鸟类特征确定预期第二鸟类特征,所述预期第二鸟类特征反映实际栖息地中所述第二鸟类特征的预估值;
基于所述预期第二鸟类特征与所述第二鸟类特征确定所述预期第二鸟类特征与所述第二鸟类特征的符合程度;
基于所述符合程度确定所述分析结果。
6.一种基于鸟类特征识别的栖息地环境调节系统,其特征在于,所述系统包括至少一个声纹监测前端设备、至少一个环境监测装置、至少一个环境调节装置和处理器:
所述声纹监测前端设备被配置为获取多个预设时间段的原始声音数据;
所述环境监测装置被配置为获取环境数据;
所述环境调节装置被配置为基于至少一组环境调节参数调节环境数据;
所述处理器被配置为:
基于原始声音数据提取声纹数据;
基于所述声纹数据确定鸟类声纹模型,基于所述鸟类声纹模型确定多个预设时间段的第一鸟类特征,所述第一鸟类特征至少包括鸟类物种和对应的鸟类数量,所述鸟类声纹模型为深度卷积循环神经网络模型;
基于所述多个预设时间段的所述第一鸟类特征和所述声纹数据,确定第二鸟类特征,所述第二鸟类特征至少包括种群行为特征以及种群规模;
基于环境数据和所述第二鸟类特征,确定分析结果,所述分析结果包括至少一个栖息地的环境质量以及所述至少一个栖息地的设备更新数量和/或设备位置分布;
基于所述分析结果,确定至少一组环境调节参数和至少一组设备调动参数,所述环境调节参数包括所述至少一个栖息地的蓄水量,所述至少一组设备调动参数包括至少一个声纹监测前端设备的设备位置;
将所述至少一组环境调节参数发送至对应的环境调节装置,将所述至少一组设备调动参数发送至对应的声纹监测前端设备。
7.如权利要求6所述系统,其特征在于,所述处理器进一步被配置为:
基于所述环境数据、所述多个预设时间段的所述第一鸟类特征和所述声纹数据,通过鸟类行为模型确定所述第二鸟类特征,所述鸟类行为模型为深度神经网络DNN模型、神经网络NN模型中的至少一种。
8.如权利要求7所述系统,其特征在于,所述鸟类行为模型的输出还包括所述第二鸟类特征的置信度,所述鸟类行为模型包括声纹特征提取层和特征确定层;
所述声纹特征提取层基于所述环境数据和所述声纹数据,确定声纹特征;
所述特征确定层基于所述声纹特征和所述多个预设时间段的所述第一鸟类特征,确定所述第二鸟类特征和所述第二鸟类特征的所述置信度。
9.如权利要求8所述系统,其特征在于,所述声纹数据还包括补充声纹数据,所述系统还包括模拟鸟叫装置;
所述模拟鸟叫装置被配置为基于模拟鸟叫指令进行模拟鸟叫;
所述声纹监测前端设备被配置为基于模拟鸟叫,获取进行所述模拟鸟叫后的预设时间段内的声音数据作为扩充原始数据;
所述处理器进一步被配置为:
响应于所述声纹数据的数据量小于预设阈值,基于声纹监测前端设备获取所述扩充原始数据;
基于所述扩充原始数据,确定所述补充声纹数据。
10.如权利要求6所述系统,其特征在于,所述处理器进一步被配置为:
基于所述环境数据和所述多个预设时间段的所述第一鸟类特征确定预期第二鸟类特征,所述预期第二鸟类特征反映实际栖息地中所述第二鸟类特征的预估值;
基于所述预期第二鸟类特征与所述第二鸟类特征确定所述预期第二鸟类特征与所述第二鸟类特征的符合程度;
基于所述符合程度确定所述分析结果。
CN202410220304.2A 2024-02-28 2024-02-28 一种基于鸟类特征识别的栖息地环境调节方法和系统 Active CN117809662B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410220304.2A CN117809662B (zh) 2024-02-28 2024-02-28 一种基于鸟类特征识别的栖息地环境调节方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410220304.2A CN117809662B (zh) 2024-02-28 2024-02-28 一种基于鸟类特征识别的栖息地环境调节方法和系统

Publications (2)

Publication Number Publication Date
CN117809662A CN117809662A (zh) 2024-04-02
CN117809662B true CN117809662B (zh) 2024-05-10

Family

ID=90432295

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410220304.2A Active CN117809662B (zh) 2024-02-28 2024-02-28 一种基于鸟类特征识别的栖息地环境调节方法和系统

Country Status (1)

Country Link
CN (1) CN117809662B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489446A (zh) * 2013-10-10 2014-01-01 福州大学 复杂环境下基于自适应能量检测的鸟鸣识别方法
CN106504762A (zh) * 2016-11-04 2017-03-15 中南民族大学 鸟类群落数量估计系统及其方法
CN110120224A (zh) * 2019-05-10 2019-08-13 平安科技(深圳)有限公司 鸟声识别模型的构建方法、装置、计算机设备及存储介质
CN111310098A (zh) * 2019-12-17 2020-06-19 华南理工大学 一种湿地公园鸟类多样性恢复方法
CN112331220A (zh) * 2020-11-17 2021-02-05 中国计量大学 一种基于深度学习的鸟类实时识别方法
CN112735442A (zh) * 2020-12-25 2021-04-30 刘添忻 一种具有音频分离声纹识别的湿地生态监测系统及其音频分离方法
WO2023041542A1 (en) * 2021-09-14 2023-03-23 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Modulation of animal behaviour
CN117611885A (zh) * 2023-11-17 2024-02-27 贵州省生物研究所 一种基于Canny边缘检测的候鸟生态调控方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7377233B2 (en) * 2005-01-11 2008-05-27 Pariff Llc Method and apparatus for the automatic identification of birds by their vocalizations
CA2861660A1 (en) * 2012-01-08 2013-07-11 Imagistar Llc System and method for item self-assessment as being extant or displaced

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489446A (zh) * 2013-10-10 2014-01-01 福州大学 复杂环境下基于自适应能量检测的鸟鸣识别方法
CN106504762A (zh) * 2016-11-04 2017-03-15 中南民族大学 鸟类群落数量估计系统及其方法
CN110120224A (zh) * 2019-05-10 2019-08-13 平安科技(深圳)有限公司 鸟声识别模型的构建方法、装置、计算机设备及存储介质
CN111310098A (zh) * 2019-12-17 2020-06-19 华南理工大学 一种湿地公园鸟类多样性恢复方法
CN112331220A (zh) * 2020-11-17 2021-02-05 中国计量大学 一种基于深度学习的鸟类实时识别方法
CN112735442A (zh) * 2020-12-25 2021-04-30 刘添忻 一种具有音频分离声纹识别的湿地生态监测系统及其音频分离方法
WO2023041542A1 (en) * 2021-09-14 2023-03-23 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Modulation of animal behaviour
CN117611885A (zh) * 2023-11-17 2024-02-27 贵州省生物研究所 一种基于Canny边缘检测的候鸟生态调控方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
人工智能助力生物多样性监测与保护;张渊媛等;可持续发展导刊;20230331;全文 *
声学手段辅助自然保护地生物多样性监测 现状及应用建议;许晓青等;自然保护地;20231130;全文 *

Also Published As

Publication number Publication date
CN117809662A (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
Ruff et al. Automated identification of avian vocalizations with deep convolutional neural networks
Richards et al. Using image recognition to automate assessment of cultural ecosystem services from social media photographs
Priyadarshani et al. Automated birdsong recognition in complex acoustic environments: a review
CN102804208B (zh) 为视觉搜索应用自动挖掘名人的个人模型
CN111110902B (zh) 香薰机的控制方法、装置、存储介质及电子设备
CN114627467B (zh) 基于改进神经网络的水稻生育期识别方法及系统
Marin-Cudraz et al. Acoustic monitoring of rock ptarmigan: A multi-year comparison with point-count protocol
Cerqueira et al. Rare or elusive? A test of expert knowledge about rarity of Amazon forest birds
CN114463675A (zh) 一种水下鱼类群组活动强度识别方法及装置
Nagy et al. Identification of individual Eastern Screech-Owls Megascops asio via vocalization analysis
CN115294994A (zh) 一种真实环境中的鸟类鸣声自动识别系统
Gage et al. Acoustic observations in agricultural landscapes
Smith-Vidaurre et al. Individual vocal signatures show reduced complexity following invasion
CN112905001B (zh) 一种基于脑电信号的驾驶声音模式切换方法及系统
Morales et al. Method for passive acoustic monitoring of bird communities using UMAP and a deep neural network
CN117809662B (zh) 一种基于鸟类特征识别的栖息地环境调节方法和系统
Stiffler et al. Quantitative acoustic differentiation of cryptic species illustrated with King and Clapper rails
Stattner et al. Acoustic scheme to count bird songs with wireless sensor networks
CN115170942B (zh) 一种声音与视觉多级融合的鱼类行为识别方法
CN115965143A (zh) 一种基于生理信息特征融合的大学生成绩预测方法
Clink et al. Limited evidence for individual signatures or site-level patterns of variation in male Northern gray gibbon (Hylobates funereus) duet codas
Hockman Acoustic monitoring of wildlife in inaccessible areas and automatic detection of bird songs from continuous recordings
Pillai et al. Monitoring Urban Wetland Bird Migrations using IoT and ML Techniques
Gorgeva et al. Acoustic monitoring of carrion fly activity on human remains: a preliminary study
Morgan Practical Techniques for and Applications of Deep Learning Classification of Long-Term Acoustic Datasets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant