CN108198562A - 一种用于实时定位辨识动物舍内异常声音的方法及系统 - Google Patents
一种用于实时定位辨识动物舍内异常声音的方法及系统 Download PDFInfo
- Publication number
- CN108198562A CN108198562A CN201810111942.5A CN201810111942A CN108198562A CN 108198562 A CN108198562 A CN 108198562A CN 201810111942 A CN201810111942 A CN 201810111942A CN 108198562 A CN108198562 A CN 108198562A
- Authority
- CN
- China
- Prior art keywords
- sound
- animal
- sounding
- abnormal
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/20—Position of source determined by a plurality of spaced direction-finders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/18—Artificial neural networks; Connectionist approaches
Abstract
本发明涉及一种用于实时定位辨识动物舍内异常声音的方法及系统,其包括:获取实时声音数据;根据获取的实时声音数据检测是否有动物异常声音;当检测到有动物异常声音时,定位该异常声音来源方向;在异常声音来源方向,定位发声动物的精确位置;标记的动物异常声音和发声位置,存储成历史音频文件形式。本发明采用非侵入式、连续、实时的声音系统来监测夜间动物的异常发声状况,辅助养殖人员对夜间动物异常发声进行准确地辨识,提高识别动物发声类型的准确率及定位精度。实现24小时连续监测动物舍,该系统可以节省人力物力,极大地提高饲养管理效率。
Description
技术领域
本发明涉及一种畜禽数字化养殖领域,特别是关于一种用于实时定位辨识动物舍内异常声音的方法及系统。
背景技术
声音分析技术已经成为研究动物行为、动物健康和动物福利的一种重要手段,通过监测动物发声可了解其自身的健康状况以及个体需求,也是一种评价动物行为、福利的辅助方法。然而,规模化养殖鸡舍中动物数量繁多,对日常饲养管理提出巨大挑战,要求饲养员一天24小时监控鸡舍难以实现,而且人员的进出会给鸡群带来较大应激,此外,鸡舍中突发异常状况未能及时反馈生产者,会造成不可估量的经济损失,如:夏季鸡舍热应激。然而,仅仅通过人耳或人眼是不能对畜禽舍进行24小时连续监控并记录的。此外,市面上现有的摄像头和麦克风仅提供音视频监测的基础功能模块,并未同实际的养殖生产相结合,关联动物行为和动物福利的内容。
目前现有技术,公开了通过声音信号对道路上鸣笛的机动车进行识别的方法,以及用于实时定位鸣笛的机动车的方法及系统,用噪声源定位计算,包括:延迟累加算法或MUSIC算法,获取鸣笛车辆并判别噪声特征,进行鸣笛车辆车牌抓拍识别。比利时学者M.Silva等采用TDOA技术和麦克风阵列系统监测猪舍呼吸道疾病,8个麦克风组成不同的形状分散安装在猪舍中用于捕捉猪咳嗽声音。虽然国内交通领域的鸣笛抓拍技术较成熟,但是畜禽舍内动物的叫声是非短时平稳信号,而且干扰声源较多,并不能较好地应用于畜禽舍监测中,此外,国外学者的研究局限于对猪、牛等体型较大动物的发声定位,个体数量较多的动物群体如蛋鸡、肉鸡等,基于TDOA技术的算法效率和准确度会受到较大影响。因此,迫切需要一种适用于规模化畜禽舍的声音监测系统。
发明内容
针对上述问题,本发明的目的是提供一种用于实时定位辨识动物舍内异常声音的方法及系统,其采用非侵入式、连续、实时的声音系统来监测夜间动物的异常发声状况,辅助养殖人员对夜间动物异常发声进行准确地辨识,提高识别动物发声类型的准确率及定位精度。实现24小时连续监测动物舍,该系统可以节省人力物力,极大地提高饲养管理效率。
为实现上述目的,本发明采取以下技术方案:一种用于实时定位辨识动物舍内异常声音的方法,其特征在于包括以下步骤:1)获取实时声音数据;2)根据获取的实时声音数据检测是否有动物异常声音;3)当检测到有动物异常声音时,定位该异常声音来源方向;4)在异常声音来源方向,定位发声动物的精确位置;5)标记的动物异常声音和发声位置,存储成历史音频文件形式。
进一步,所述分布式麦克风阵列采用平面矩形结构或多平面立体结构。
进一步,所述步骤2)中,根据实时声音数据检测动物异常声音的方法包括以下步骤:2.1)将获取的实时声音信号转化为音频数据;2.2)判断音频数据中的声压是否高于预先设定的声压阈值,高于则进入下一步,反之则忽略不计;2.3)在声压高于阈值声压时,判断音频数据中在400Hz~2500Hz频率范围内是否存在单峰值或多峰值特征,存在则进入下一步,反之则忽略不计;2.4)当出现单峰值或多峰值特征时,利用神经网络音色模型对音频数据进行识别,判断其声音类型为鸣叫声、饮水声、产蛋叫声、采食声、机械噪声或其它声音;2.5)当判断结果为其它声音时,将该音频标记为异常声音。
进一步,所述步骤2.4)中,神经网络音色模型的建立过程包括以下步骤:2.4.1)对单峰值或多峰值特征的音频信号进行特征提取:提取的特征为MFCC和TF特征的组合特征;MFCC为梅尔频率倒谱系数,TF为三色共振峰;MFCC的计算步骤为:(1)预加重:采用有限脉冲响应滤波器处理音频信号;(2)对预加重处理后的音频信号进行分帧;(3)对分帧后的音频信号进行离散傅里叶变换及分割:每一帧经过离散傅里叶变换后,再采用三角形滤波器组成的滤波器组进行分割;(4)对分割后的音频信号进行离散余弦变换,选取12维静态特征向量作为特征参数的输入;2.4.2)选取反向传播神经网络作为分类器,对组合特征进行分类识别。
进一步,所述TF特征是依据动物发声机制进行提取,提取动物前三个主要共振峰特征,获取其三色共振峰特征TFi:
式中,Fi表示不同共振峰,i=1,2,3;选取TF的3维特征向量作为特征参数的输入。
进一步,所述三个主要共振峰是指峰值最大的三个共振峰,其中第一共振峰的峰值最大;第二共振峰的峰值小于第一共振峰,频率高于第一共振峰;第三共振峰的峰值小于第二共振峰,频率高于第二共振峰。
进一步,所述步骤3)中,异常声音来源方向的定位是采用对声源区域利用基于最大声能量算法进行定位计算;所述步骤4)中,动物发声的精确位置定位是采用基于SRP-PHAT算法或可控功率响应算法进行声源精准定位计算。
进一步,所述基于SRP-PHAT算法进行声源精准定位计算的步骤如下:4.1)假设动物发声点位于每个单元内,则根据各单元的几何位置关系估计出动物声音到达各个分布式麦克风的时间差;4.2)将各麦克风采集的音频波形进行时间延迟补偿,进而计算出广义互相关GCC的值,GCC为声源定位算法;4.3)将多对通道GCC进行累加计算,得到各个区域块累计之后的声功率值,声功率值最大的区域块位置为真实声源的估计位置。
进一步,所述步骤4.3)中,若同时存在多个可能的声源位置,则将声功率值按从大到小排列,列举可能性的几个声源所在区域块,利用神经网络音色模型再次对音频数据进行判别;若该声音类型属于其它声音,则将记录所有定位的区域块位置信息,若不属于,则不记录。
为实现上述目的,本发明还提供另一种技术方案:一种用于实时定位辨识动物舍内异常声音的系统,其特征在于:该系统包括声音实时获取模块、声音辨识模块、声源方向定位模块、发声定位模块和存储模块;所述声音实时获取模块用于获取实时声音数据;所述声音辨识模块用于根据实时声音数据判断是否有异常动物声音;所述声源方向定位模块用于定位异常动物声音来源方向;所述发声定位模块通过异常声音的来源方向定位发声动物所在精确位置;所述存储模块用于标记动物异常声音和发声位置,存储成历史音频文件形式。
本发明由于采取以上技术方案,其具有以下优点:1、本发明基于LabVIEW平台,利用麦克风阵列实时监测动物声音,通过对声源进行降噪、识别,能够准确地确定动物异常发声所在的区域位置,以此来辅助饲养员实现24小时连续监测,本方案省时省力,是一种无应激、快捷的自动化监测手段,在保证不影响正常生产过程的情况下极大地提高饲养管理的效率。2、本发明通过声音定位可同时捕获多个动物异常发声区域。3、本发明方法可应用于在线的动物健康监测系统,以评价动物福利和动物健康状况,辅助人工巡检畜禽舍,提高生产管理效率。本发明同时可应用到其它动物发声研究领域中作为自动化评价动物福利和动物健康的方法之一。
附图说明
图1是本发明的整体流程示意图;
图2是本发明的分布式麦克风阵列结构示意图;
图3是本发明的检测动物异常声音方法流程示意图;
图4是本发明实施例中用于实时监测蛋鸡发声的分布式麦克风阵列定位辨识方法流程示意图;
图5a是本发明实施例中鸡舍平面结构示意图;
图5b是本发明实施例中鸡舍立体结构示意图。
具体实施方式
本发明旨在提供一种非侵入式、连续、实时的声音系统来监测夜间动物的异常发声状况,辅助养殖人员对夜间动物异常发声进行准确地辨识,并统计发声区域。下面结合附图和实施例对本发明进行详细的描述。
如图1所示,本发明提供一种用于实时定位辨识动物舍内异常声音的方法,该方法基于LabVIEW平台,利用麦克风阵列实时监测动物异常声音,其包括以下步骤:
1)获取实时声音数据;
2)根据获取的实时声音数据检测是否有动物异常声音;
3)当检测到有动物异常声音时,定位该异常声音来源方向;
4)在异常声音来源方向,定位发声动物的精确位置;
5)标记的动物异常声音和发声位置,存储成历史音频文件形式,饲养管理员可随时调出查询任意一天的动物舍情况,为追溯饲养管理问题提供基础数据支持。
在一个优选的实施例中,实时声音数据采用分布式麦克风阵列进行获取。
上述实施例中,分布式麦克风阵列采用平面矩形结构或多平面立体结构。当采用平面矩形结构时,多个麦克风划分成四组单元分别设置在动物舍某一壁面;当采用多平面立体结构时,多个麦克风划分成多组单元,分别设置在动物舍的各顶角位置处(如图2所示)。
在一个优选的实施例中,如图3所示,根据实时声音数据检测动物异常声音的方法包括以下步骤:
2.1)将获取的实时声音信号转化为音频数据;
2.2)判断音频数据中的声压是否高于预先设定的声压阈值,高于则进入下一步,反之则忽略不计;其中,声压阈值优选为65dB;
2.3)在声压高于阈值声压时,判断音频数据中在400Hz~2500Hz频率范围内是否存在单峰值或多峰值特征,存在则进入下一步,反之则忽略不计;
2.4)当出现单峰值或多峰值特征时,利用神经网络音色模型对音频数据进行识别,判断其声音类型:鸣叫声、饮水声、产蛋叫声、采食声、机械噪声或其它声音;
神经网络音色模型的建立过程包括以下步骤:
2.4.1)对单峰值或多峰值特征的音频信号进行特征提取:提取的特征为梅尔频率倒谱系数(MFCC)和三色共振峰(TF)特征的组合特征;
MFCC的计算步骤为:
(1)预加重:为了降低噪声,加强高频频谱成分,采用有限脉冲响应滤波器处理音频信号。该滤波器的系统函数为H(z)=1-az-1,a∈[0.95,0.98]。
(2)对预加重处理后的音频信号进行分帧:为了避免丢失信息,采用50%的重叠帧,窗口函数采用汉明窗。
(3)对分帧后的音频信号进行离散傅里叶变换及分割:因为人类对音调的感知是非线性的,故每一帧经过离散傅里叶变换后,再采用三角形滤波器组成的滤波器组(1kHz以下,呈近似线性;1kHz以上,呈对数曲线)进行分割。
(4)对分割后的音频信号进行离散余弦变换,选取12维静态特征向量作为特征参数的输入:因为第0系数是平均对数能量值,通常被舍弃,故选取MFCC的12维静态特征向量作为特征参数的输入。
三色共振峰(TF)特征是依据动物发声机制进行提取。动物的不同类型叫声的共振峰特征是变化多端的,而共振峰又同动物声道特点密切相关,提取动物前三个主要共振峰特征,获取其三色共振峰特征TFi:
式中,Fi表示不同共振峰,i=1,2,3。选取TF的3维特征向量作为特征参数的输入。其中,三个主要共振峰是指峰值最大的三个共振峰,其中第一共振峰的峰值最大,第二共振峰的峰值小于第一共振峰,但是频率高于第一共振峰,第三共振峰的峰值小于第二共振峰,频率高于第二共振峰。一般情况下,前三个共振峰就足够描述动物发声特点,第四、第五…第N个共振峰值相对于前三个共振峰而言,能量衰减较大,体现在峰值较低,且不突出。
哺乳动物发声是由喉部的声带振动产生的(声源,决定着基音频率的大小),并经声道过滤(滤波器,产生诸多共振声波的峰值,即共振峰)。在鸟类中,声音是通过气管中的鸣管发声。在哺乳动物的发音中,咽鼓管的收缩功能与喉部的功能类似,气管作为一个滤波器,可以去除某些频率,或者保持其它的频率不变。基频特征同其鸣管中的振动体的振动相关(蛋鸡发声的基频大多数位于400Hz-2500Hz之间)。故采用三色共振峰(TF)特征能有效提高识别动物发声类型的准确率。
2.4.2)选取反向传播神经网络(BPNN)作为分类器,对组合特征进行分类识别;
神经网络是一个多层次、前馈神经网络,它由输入层、隐藏层和输出层三个部分构成:(1)输入层:提取特征创建输入向量,输入至输入层;(2)隐藏层:根据经验预先设定隐藏层的数目,通常由试验和误差决定;(3)输出层:输出训练集中设定的不同类别。在本实施例中,设定5个隐藏层,设置1000次最大迭代次数和0.001最小步长。
使用时,神经网络音色模型的建模样本数设置有4101个声音样本片段,每一片段时长0.2秒,50%的样本作为训练集,50%的样本作为测试集,基于LabVIEW平台进行特征提取和分类识别,选取的声音类型如表1所示。
表1不同声音类型的定义
声音类型 | 定义 | 样本数量 |
饮水声 | 蛋鸡饮水时,啄击打饮水器的声音 | 353 |
鸣叫声 | 蛋鸡正常的鸣叫声音 | 744 |
产蛋叫声 | 蛋鸡的产蛋过程发出的声音 | 1984 |
采食声 | 蛋鸡饲喂阶段采食时发出的声音 | 690 |
风机噪声 | 蛋鸡舍常见机械噪声,风机运转的声音 | 330 |
则神经网络音色模型的识别率如表2所示。
表2不同声音特征的识别率
2.5)当判断结果为其它声音时,将该音频标记为异常声音。
在一个优选的实施例中,异常声音来源方向的定位是采用对声源区域利用基于最大声能量算法进行定位计算。
在一个优选的实施例中,动物发声的精确位置定位是采用基于SRP-PHAT算法或可控功率响应算法进行声源精准定位计算。
上述实施例中,基于SRP-PHAT算法进行声源精准定位计算的步骤如下:
4.1)假设动物发声点位于每个单元内,单元是预先设置的空间范围,而单元的空间范围可根据鸡舍的实际尺寸设定和调整,例如,如图2所示,每个单元内包含5组笼架,每个笼架分为4层,区域块定义为编号1号笼1层、2号笼1层…5号笼4层,根据各单元的几何位置关系可估计出动物声音(例如蛋鸡声音)到达各个分布式麦克风的时间差;
4.2)将各麦克风采集的音频波形进行时间延迟补偿,进而计算出广义互相关GCC的值;GCC为声源定位算法,是用于估计信号之间的时延;
4.3)将多对通道GCC进行累加计算,得到各个区域块累计之后的声功率值,声功率值最大的区域块位置即为真实声源的估计位置。
上述步骤4.3)中,若同时存在多个可能的声源位置,则将声功率值按从大到小排列,列举可能性的声源所在区域块,利用神经网络音色模型再次对音频数据进行判别。若该声音类型属于其它声音,则将记录所有定位的区域块位置信息;若不属于,则不记录。
本发明还提供一种用于实时定位辨识动物舍内异常声音的系统,其包括声音实时获取模块、声音辨识模块、声源方向定位模块、发声定位模块和存储模块。
声音实时获取模块用于获取实时声音数据;其采用分布式麦克风阵列;
声音辨识模块用于根据实时声音数据判断是否有异常动物声音;
声源方向定位模块用于定位异常动物声音来源方向;
发声定位模块通过异常声音的来源方向定位发声动物所在精确位置;
存储模块用于标记动物异常声音和发声位置,存储成历史音频文件形式,为追溯饲养管理问题提供基础数据支持。
综上所述,本发明用于实时检测动物发声的系统及方法,能够对动物异常发声进行定位并识别。
实施例:以下蛋鸡为例对本发明作进一步介绍,但并不用来限制本发明的保护范围。
如图4、图5a、图5b所示,在一栋长100米、宽15米、高5米的规模化蛋鸡舍中,共有5架叠层笼养鸡笼,每架鸡笼长90米、宽1.5米、高4米,每个子鸡笼区域的大小为长1.2米、宽1.2米、高0.9米。在侧墙和屋顶边角各安装四元麦克风阵列,麦克风选用GRAS 40PP,如图2所示,每个单元包含6个麦克风,组成单元麦克风阵列,单元与单元之间间距这里根据鸡舍高度设置为5米,共有20个单元,组成分布式麦克风阵列系统。声音信号采集和分析平台采用NI公司PXI-1050机箱配备PXI-8840控制器和PXI-4472B采集卡同步记录声音数据,麦克风和采集卡通过BNC线缆连接,声音信号传输至PXI-8840控制器后基于LabVIEW软件平台和相关算法程序进一步处理分析,采样频率设置为22kHz。
采集的声音信号需要经过降噪处理,默认带通滤波400~2500Hz。判断音频数据中的声压是否高于声压阈值65dB(默认声压阈值),如果判断低于声压阈值,继续进行监测直到高于声压阈值,进一步判断范围内是否存在单峰值或多峰值特征。同时满足上述条件时,再进行音频数据类型的识别工作。
音频数据类型识别主要利用神经网络音色模型对音频数据进行识别,判断其声音类型是:鸣叫声、饮水声、产蛋叫声、采食声、机械噪声、其它声音。神经网络音色模型是根据蛋鸡发声音色特征建立的模型,提取的蛋鸡音频特征有:MFCC特征、共振峰特征等,分类器选取BP神经网络分类器。采集的音频数据样本中,50%的样本作为训练集,50%的样本作为测试集,目前对上述类型声音的平均识别率可达85%以上。当识别结果为其它声音时,将该音频标记为异常声音。
当有蛋鸡异常声音时,基于分布式麦克风阵列定位声音来源方向,计算每个分布式麦克风阵列单元的平均声压值,得到声压大于65dB的单元分布,再进行声源精准定位计算。声压(sound pressure)是大气压受到声波扰动后产生的变化。由于声压的测量比较容易实现,通过声压的测量也可以间接求得质点速度等其它物理量,所以声学中常用这个物理量来描述声波。它是随时间变化的,实测声压测量的是声压的有效值,单位是Pa或MPa。表示声压大小的指标称为声压级(soundpressure level),用某声音的声压(p)与基本声压值(p0)之比的常用对数的20倍来表示,即20lgP/P0,单位为dB。
声源精准定位计算,以SRP-PHAT算法为例,在三维空间中划分多个计算区域块,假设蛋鸡发声点位于每个区域块内,可根据几何关系估计出蛋鸡声音到达各个分布式麦克风的时间差,然后将各麦克风采集的音频波形进行相应的时间延迟补偿,以此计算出GCC的值,将多对通道GCC进行累加计算,可得到各个区域块累计之后的声功率值,使该声功率值最大所对应的区域块位置,即为真实声源的估计位置。当然,如果同时存在多个可能的声源位置,可将声功率按从大到小排列列举可能性的几个声源所在区域块。在本案例中,区域块是在每个单元麦克风阵列中划分,即长5米宽15米高5米,如图2所示,每个单元内包含5组笼架,每个笼架分为4层,区域块定义为编号1号笼1层、2号笼1层…5号笼4层,声源精准定位的思想是为了确定蛋鸡发声时所处具体笼架的位置,便于饲养员快速发现禽舍内异常声音。
最终,标记的蛋鸡异常声音和发声区域块将被存储成历史音频文件形式,饲养管理员可随时调出查询任意一天的鸡舍情况,为追溯饲养管理问题提供基础数据支持。例如:家禽呼吸道疾病的夜间连续监测。在保证该系统设备正常运转下,鸡舍夜间感染呼吸道疾病的鸡只会发出异常声音(呼吸啰音、呼噜声、打喷嚏声等),借助分布式麦克风阵列系统实时监测蛋鸡发声时间、发声频次、发声区域,将有助于饲养管理者提前预防呼吸道疾病的大范围爆发,降低生产损失。
上述各实施例仅用于说明本发明,各个步骤都是可以有所变化的,在本发明技术方案的基础上,凡根据本发明原理对个别部件进行的改进和等同变换,均不应排除在本发明的保护范围之外。同时,根据本发明实施的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在移动硬盘中或网络上,包括若干指令以使得一台计算设备(个人计算机、服务器或网络设备等)执行根据本发明实施例的方法。
Claims (10)
1.一种用于实时定位辨识动物舍内异常声音的方法,其特征在于包括以下步骤:
1)获取实时声音数据;
2)根据获取的实时声音数据检测是否有动物异常声音;
3)当检测到有动物异常声音时,定位该异常声音来源方向;
4)在异常声音来源方向,定位发声动物的精确位置;
5)标记的动物异常声音和发声位置,存储成历史音频文件形式。
2.如权利要求1所述方法,其特征在于:所述实时声音数据采用分布式麦克风阵列进行获取;所述分布式麦克风阵列采用平面矩形结构或多平面立体结构。
3.如权利要求1所述方法,其特征在于:所述步骤2)中,根据实时声音数据检测动物异常声音的方法包括以下步骤:
2.1)将获取的实时声音信号转化为音频数据;
2.2)判断音频数据中的声压是否高于预先设定的声压阈值,高于则进入下一步,反之则忽略不计;
2.3)在声压高于阈值声压时,判断音频数据中在400Hz~2500Hz频率范围内是否存在单峰值或多峰值特征,存在则进入下一步,反之则忽略不计;
2.4)当出现单峰值或多峰值特征时,利用神经网络音色模型对音频数据进行识别,判断其声音类型为鸣叫声、饮水声、产蛋叫声、采食声、机械噪声或其它声音;
2.5)当判断结果为其它声音时,将该音频标记为异常声音。
4.如权利要求3所述方法,其特征在于:所述步骤2.4)中,神经网络音色模型的建立过程包括以下步骤:
2.4.1)对单峰值或多峰值特征的音频信号进行特征提取:提取的特征为MFCC和TF特征的组合特征;MFCC为梅尔频率倒谱系数,TF为三色共振峰;
MFCC的计算步骤为:
(1)预加重:采用有限脉冲响应滤波器处理音频信号;
(2)对预加重处理后的音频信号进行分帧;
(3)对分帧后的音频信号进行离散傅里叶变换及分割:每一帧经过离散傅里叶变换后,再采用三角形滤波器组成的滤波器组进行分割;
(4)对分割后的音频信号进行离散余弦变换,选取12维静态特征向量作为特征参数的输入;
2.4.2)选取反向传播神经网络作为分类器,对组合特征进行分类识别。
5.如权利要求3所述方法,其特征在于:所述TF特征是依据动物发声机制进行提取,提取动物前三个主要共振峰特征,获取其三色共振峰特征TFi:
式中,Fi表示不同共振峰,i=1,2,3;选取TF的3维特征向量作为特征参数的输入。
6.如权利要求5所述方法,其特征在于:所述三个主要共振峰是指峰值最大的三个共振峰,其中第一共振峰的峰值最大;第二共振峰的峰值小于第一共振峰,频率高于第一共振峰;第三共振峰的峰值小于第二共振峰,频率高于第二共振峰。
7.如权利要求1所述方法,其特征在于:所述步骤3)中,异常声音来源方向的定位是采用对声源区域利用基于最大声能量算法进行定位计算;所述步骤4)中,动物发声的精确位置定位是采用基于SRP-PHAT算法或可控功率响应算法进行声源精准定位计算。
8.如权利要求7所述方法,其特征在于:所述基于SRP-PHAT算法进行声源精准定位计算的步骤如下:
4.1)假设动物发声点位于每个单元内,则根据各单元的几何位置关系估计出动物声音到达各个分布式麦克风的时间差;
4.2)将各麦克风采集的音频波形进行时间延迟补偿,进而计算出广义互相关GCC的值,GCC为声源定位算法;
4.3)将多对通道GCC进行累加计算,得到各个区域块累计之后的声功率值,声功率值最大的区域块位置为真实声源的估计位置。
9.如权利要求8所述方法,其特征在于:所述步骤4.3)中,若同时存在多个可能的声源位置,则将声功率值按从大到小排列,列举可能性的几个声源所在区域块,利用神经网络音色模型再次对音频数据进行判别;若该声音类型属于其它声音,则将记录所有定位的区域块位置信息,若不属于,则不记录。
10.一种用于实时定位辨识动物舍内异常声音的系统,其特征在于:该系统包括声音实时获取模块、声音辨识模块、声源方向定位模块、发声定位模块和存储模块;
所述声音实时获取模块用于获取实时声音数据;
所述声音辨识模块用于根据实时声音数据判断是否有异常动物声音;
所述声源方向定位模块用于定位异常动物声音来源方向;
所述发声定位模块通过异常声音的来源方向定位发声动物所在精确位置;
所述存储模块用于标记动物异常声音和发声位置,存储成历史音频文件形式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810111942.5A CN108198562A (zh) | 2018-02-05 | 2018-02-05 | 一种用于实时定位辨识动物舍内异常声音的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810111942.5A CN108198562A (zh) | 2018-02-05 | 2018-02-05 | 一种用于实时定位辨识动物舍内异常声音的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108198562A true CN108198562A (zh) | 2018-06-22 |
Family
ID=62592743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810111942.5A Pending CN108198562A (zh) | 2018-02-05 | 2018-02-05 | 一种用于实时定位辨识动物舍内异常声音的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108198562A (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243470A (zh) * | 2018-08-16 | 2019-01-18 | 南京农业大学 | 基于音频技术的肉鸡咳嗽监测方法 |
CN109258509A (zh) * | 2018-11-16 | 2019-01-25 | 太原理工大学 | 一种生猪异常声音智能监测系统与方法 |
CN109632086A (zh) * | 2019-01-10 | 2019-04-16 | 深圳市沃特沃德股份有限公司 | 车内噪音检测方法、装置、可读存储介质及计算机设备 |
CN109817227A (zh) * | 2018-12-06 | 2019-05-28 | 洛阳语音云创新研究院 | 一种养殖场的异常声音监测方法和系统 |
CN109887526A (zh) * | 2019-01-04 | 2019-06-14 | 平安科技(深圳)有限公司 | 对母羊的生理状态检测方法、装置、设备及存储介质 |
CN110111815A (zh) * | 2019-04-16 | 2019-08-09 | 平安科技(深圳)有限公司 | 动物异常声音监控方法及装置、存储介质、电子设备 |
WO2020006935A1 (zh) * | 2018-07-05 | 2020-01-09 | 平安科技(深圳)有限公司 | 动物声纹特征提取方法、装置及计算机可读存储介质 |
CN110749862A (zh) * | 2019-10-14 | 2020-02-04 | 北京汽车股份有限公司 | 一种可变式矩阵声音定位系统及定位方法 |
CN110782905A (zh) * | 2019-11-05 | 2020-02-11 | 秒针信息技术有限公司 | 一种定位方法、装置及系统 |
WO2020127449A1 (en) * | 2018-12-18 | 2020-06-25 | Soundtalks Nv | Method for monitoring a livestock facility and/or livestock animals in a livestock facility using improved sound processing techniques |
CN111477236A (zh) * | 2020-05-14 | 2020-07-31 | 深聆科技(北京)有限公司 | 基于神经网络的仔猪叫声识别方法、养殖监控方法、系统 |
CN111543348A (zh) * | 2020-05-14 | 2020-08-18 | 深聆科技(北京)有限公司 | 养殖场的声音定位装置、方法及幼崽监控方法 |
CN111640437A (zh) * | 2020-05-25 | 2020-09-08 | 中国科学院空间应用工程与技术中心 | 一种基于深度学习的声纹识别方法及系统 |
CN112437372A (zh) * | 2020-10-28 | 2021-03-02 | 海菲曼(天津)科技有限公司 | 一种用于封闭式耳机的危险报警系统芯片 |
CN112731293A (zh) * | 2020-12-28 | 2021-04-30 | 杭州电子科技大学 | 一种非接触式的声音与振动联合检测系统及检测方法 |
CN112816060A (zh) * | 2020-12-29 | 2021-05-18 | 杭州电子科技大学 | 一种声音振动联合监测系统及其分析方法 |
CN113056188A (zh) * | 2018-12-18 | 2021-06-29 | 桑德托克斯公司 | 用于监视牲畜设施状态的装置 |
CN113057123A (zh) * | 2021-02-05 | 2021-07-02 | 广州朗国电子科技有限公司 | 一种人工智能家禽进食异常监控方法、设备以及介质 |
CN113270109A (zh) * | 2020-02-14 | 2021-08-17 | 宏碁股份有限公司 | 自动调整特定声源的方法及应用其的电子装置 |
CN113345421A (zh) * | 2020-02-18 | 2021-09-03 | 中国科学院声学研究所 | 一种基于角度谱特征的多通道远场的目标语音识别方法 |
CN113567926A (zh) * | 2021-09-24 | 2021-10-29 | 杭州格物智安科技有限公司 | 一种设备跟踪方法、系统及装置 |
CN116256054A (zh) * | 2023-05-15 | 2023-06-13 | 广东电网有限责任公司阳江供电局 | 一种桥臂电抗器的故障监测方法、系统、设备和介质 |
CN117423342A (zh) * | 2023-10-27 | 2024-01-19 | 东北农业大学 | 一种基于边缘计算的猪只异常状态监测方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102222500A (zh) * | 2011-05-11 | 2011-10-19 | 北京航空航天大学 | 结合情感点的汉语语音情感提取及建模方法 |
CN102655003A (zh) * | 2012-03-21 | 2012-09-05 | 北京航空航天大学 | 基于声道调制信号mfcc的汉语语音情感点识别方法 |
US20150112682A1 (en) * | 2008-12-10 | 2015-04-23 | Agnitio Sl | Method for verifying the identity of a speaker and related computer readable medium and computer |
CN104700829A (zh) * | 2015-03-30 | 2015-06-10 | 中南民族大学 | 动物声音情绪识别系统及其方法 |
US20160118049A1 (en) * | 2011-12-21 | 2016-04-28 | Sri International | Method and apparatus for speaker-calibrated speaker detection |
CN105609113A (zh) * | 2015-12-15 | 2016-05-25 | 中国科学院自动化研究所 | 基于双谱加权空间相关矩阵的语音声源定位方法 |
CN106847293A (zh) * | 2017-01-19 | 2017-06-13 | 内蒙古农业大学 | 设施养殖羊应激行为的声信号监测方法 |
CN107632288A (zh) * | 2017-10-27 | 2018-01-26 | 无锡七百二十度科技有限公司 | 一种声源定位系统 |
CN107643509A (zh) * | 2016-07-22 | 2018-01-30 | 腾讯科技(深圳)有限公司 | 定位方法、定位系统及终端设备 |
-
2018
- 2018-02-05 CN CN201810111942.5A patent/CN108198562A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150112682A1 (en) * | 2008-12-10 | 2015-04-23 | Agnitio Sl | Method for verifying the identity of a speaker and related computer readable medium and computer |
CN102222500A (zh) * | 2011-05-11 | 2011-10-19 | 北京航空航天大学 | 结合情感点的汉语语音情感提取及建模方法 |
US20160118049A1 (en) * | 2011-12-21 | 2016-04-28 | Sri International | Method and apparatus for speaker-calibrated speaker detection |
CN102655003A (zh) * | 2012-03-21 | 2012-09-05 | 北京航空航天大学 | 基于声道调制信号mfcc的汉语语音情感点识别方法 |
CN104700829A (zh) * | 2015-03-30 | 2015-06-10 | 中南民族大学 | 动物声音情绪识别系统及其方法 |
CN105609113A (zh) * | 2015-12-15 | 2016-05-25 | 中国科学院自动化研究所 | 基于双谱加权空间相关矩阵的语音声源定位方法 |
CN107643509A (zh) * | 2016-07-22 | 2018-01-30 | 腾讯科技(深圳)有限公司 | 定位方法、定位系统及终端设备 |
CN106847293A (zh) * | 2017-01-19 | 2017-06-13 | 内蒙古农业大学 | 设施养殖羊应激行为的声信号监测方法 |
CN107632288A (zh) * | 2017-10-27 | 2018-01-26 | 无锡七百二十度科技有限公司 | 一种声源定位系统 |
Non-Patent Citations (2)
Title |
---|
宣传忠等: "基于功率谱和共振峰的母羊发声信号识别", 《农业工程学报》 * |
曹洁等: "基于环形阵列的近场多声源波达方向跟踪", 《计算机应用研究》 * |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020006935A1 (zh) * | 2018-07-05 | 2020-01-09 | 平安科技(深圳)有限公司 | 动物声纹特征提取方法、装置及计算机可读存储介质 |
CN109243470B (zh) * | 2018-08-16 | 2020-05-05 | 南京农业大学 | 基于音频技术的肉鸡咳嗽监测方法 |
CN109243470A (zh) * | 2018-08-16 | 2019-01-18 | 南京农业大学 | 基于音频技术的肉鸡咳嗽监测方法 |
CN109258509A (zh) * | 2018-11-16 | 2019-01-25 | 太原理工大学 | 一种生猪异常声音智能监测系统与方法 |
CN109258509B (zh) * | 2018-11-16 | 2023-05-02 | 太原理工大学 | 一种生猪异常声音智能监测系统与方法 |
CN109817227A (zh) * | 2018-12-06 | 2019-05-28 | 洛阳语音云创新研究院 | 一种养殖场的异常声音监测方法和系统 |
CN109817227B (zh) * | 2018-12-06 | 2021-02-09 | 洛阳语音云创新研究院 | 一种养殖场的异常声音监测方法和系统 |
US11716970B2 (en) | 2018-12-18 | 2023-08-08 | Soundtalks Nv | Method for monitoring a livestock facility and/or livestock animals in a livestock facility using improved sound processing techniques |
CN113056785A (zh) * | 2018-12-18 | 2021-06-29 | 桑德托克斯公司 | 使用改进的声音处理技术监视牲畜设施和/或牲畜设施中的牲畜动物的方法 |
CN113056188A (zh) * | 2018-12-18 | 2021-06-29 | 桑德托克斯公司 | 用于监视牲畜设施状态的装置 |
WO2020127449A1 (en) * | 2018-12-18 | 2020-06-25 | Soundtalks Nv | Method for monitoring a livestock facility and/or livestock animals in a livestock facility using improved sound processing techniques |
BE1026886B1 (nl) * | 2018-12-18 | 2020-07-22 | Soundtalks Nv | Werkwijze voor het monitoren van een veeteeltfaciliteit en/of veeteeltdieren in een veeteeltfaciliteit met behulp van verbeterde geluidsverwerkingstechnieken |
CN109887526A (zh) * | 2019-01-04 | 2019-06-14 | 平安科技(深圳)有限公司 | 对母羊的生理状态检测方法、装置、设备及存储介质 |
CN109887526B (zh) * | 2019-01-04 | 2023-10-17 | 平安科技(深圳)有限公司 | 对母羊的生理状态检测方法、装置、设备及存储介质 |
CN109632086A (zh) * | 2019-01-10 | 2019-04-16 | 深圳市沃特沃德股份有限公司 | 车内噪音检测方法、装置、可读存储介质及计算机设备 |
CN110111815A (zh) * | 2019-04-16 | 2019-08-09 | 平安科技(深圳)有限公司 | 动物异常声音监控方法及装置、存储介质、电子设备 |
CN110749862A (zh) * | 2019-10-14 | 2020-02-04 | 北京汽车股份有限公司 | 一种可变式矩阵声音定位系统及定位方法 |
CN110782905A (zh) * | 2019-11-05 | 2020-02-11 | 秒针信息技术有限公司 | 一种定位方法、装置及系统 |
CN113270109A (zh) * | 2020-02-14 | 2021-08-17 | 宏碁股份有限公司 | 自动调整特定声源的方法及应用其的电子装置 |
CN113270109B (zh) * | 2020-02-14 | 2023-05-26 | 宏碁股份有限公司 | 自动调整特定声源的方法及应用其的电子装置 |
CN113345421A (zh) * | 2020-02-18 | 2021-09-03 | 中国科学院声学研究所 | 一种基于角度谱特征的多通道远场的目标语音识别方法 |
CN113345421B (zh) * | 2020-02-18 | 2022-08-02 | 中国科学院声学研究所 | 一种基于角度谱特征的多通道远场的目标语音识别方法 |
CN111477236A (zh) * | 2020-05-14 | 2020-07-31 | 深聆科技(北京)有限公司 | 基于神经网络的仔猪叫声识别方法、养殖监控方法、系统 |
CN111543348B (zh) * | 2020-05-14 | 2022-03-18 | 深聆科技(北京)有限公司 | 养殖场的声音定位装置、方法及幼崽监控方法 |
CN111543348A (zh) * | 2020-05-14 | 2020-08-18 | 深聆科技(北京)有限公司 | 养殖场的声音定位装置、方法及幼崽监控方法 |
CN111640437A (zh) * | 2020-05-25 | 2020-09-08 | 中国科学院空间应用工程与技术中心 | 一种基于深度学习的声纹识别方法及系统 |
CN112437372A (zh) * | 2020-10-28 | 2021-03-02 | 海菲曼(天津)科技有限公司 | 一种用于封闭式耳机的危险报警系统芯片 |
CN112437372B (zh) * | 2020-10-28 | 2022-03-11 | 头领科技(昆山)有限公司 | 一种用于封闭式耳机的危险报警系统芯片 |
CN112731293A (zh) * | 2020-12-28 | 2021-04-30 | 杭州电子科技大学 | 一种非接触式的声音与振动联合检测系统及检测方法 |
CN112816060A (zh) * | 2020-12-29 | 2021-05-18 | 杭州电子科技大学 | 一种声音振动联合监测系统及其分析方法 |
CN113057123A (zh) * | 2021-02-05 | 2021-07-02 | 广州朗国电子科技有限公司 | 一种人工智能家禽进食异常监控方法、设备以及介质 |
CN113567926A (zh) * | 2021-09-24 | 2021-10-29 | 杭州格物智安科技有限公司 | 一种设备跟踪方法、系统及装置 |
CN116256054A (zh) * | 2023-05-15 | 2023-06-13 | 广东电网有限责任公司阳江供电局 | 一种桥臂电抗器的故障监测方法、系统、设备和介质 |
CN116256054B (zh) * | 2023-05-15 | 2023-08-04 | 广东电网有限责任公司阳江供电局 | 一种桥臂电抗器的故障监测方法、系统、设备和介质 |
CN117423342A (zh) * | 2023-10-27 | 2024-01-19 | 东北农业大学 | 一种基于边缘计算的猪只异常状态监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108198562A (zh) | 一种用于实时定位辨识动物舍内异常声音的方法及系统 | |
CN106653032B (zh) | 低信噪比环境下基于多频带能量分布的动物声音检测方法 | |
CN109243470B (zh) | 基于音频技术的肉鸡咳嗽监测方法 | |
Villanueva-Rivera et al. | A primer of acoustic analysis for landscape ecologists | |
CN109817227B (zh) | 一种养殖场的异常声音监测方法和系统 | |
Exadaktylos et al. | Real-time recognition of sick pig cough sounds | |
CN106847293A (zh) | 设施养殖羊应激行为的声信号监测方法 | |
Liu et al. | A novel method for broiler abnormal sound detection using WMFCC and HMM | |
CN112164408A (zh) | 基于深度学习的猪咳嗽声监测与预警系统 | |
CN103546853A (zh) | 一种基于短时傅里叶变换的扬声器异常音检测方法 | |
CN110580916B (zh) | 体重声学测量模型的创建方法与体重测量方法、装置 | |
CN112331231B (zh) | 基于音频技术的肉鸡采食量检测系统 | |
Dufour et al. | First automatic passive acoustic tool for monitoring two species of procellarides (Pterodroma baraui and Puffinus bailloni) on Reunion Island, Indian Ocean | |
CN112820275A (zh) | 一种基于声音信号分析哺乳仔猪异常的自动监测方法 | |
FOTHERINGHAM et al. | Song transmission and auditory perception of distance in wood warblers (Parulinae) | |
CN113707158A (zh) | 一种基于VGGish迁移学习网络的电网危害鸟种鸣声识别方法 | |
CN115048984A (zh) | 一种基于深度学习的母猪发情声识别方法 | |
CN108615536A (zh) | 基于麦克风阵列的时频联合特征乐器音质评价系统及方法 | |
CN115810365A (zh) | 一种基于猪只声音的猪只健康预警方法及系统 | |
CN114049897A (zh) | 一种电器设备的控制方法、装置、电子设备和存储介质 | |
Du et al. | A tristimulus-formant model for automatic recognition of call types of laying hens | |
CN115512718A (zh) | 用于存量语音文件的语音质量评价方法、装置及系统 | |
CN109031202A (zh) | 基于听觉场景分析的室内环境区域定位系统及方法 | |
Chavdar et al. | SCarrie: A Real-Time System for Sound Event Detection for Assisted Living | |
Guyot et al. | Sinusoidal modelling for ecoacoustics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180622 |