CN112331231B - 基于音频技术的肉鸡采食量检测系统 - Google Patents

基于音频技术的肉鸡采食量检测系统 Download PDF

Info

Publication number
CN112331231B
CN112331231B CN202011326934.6A CN202011326934A CN112331231B CN 112331231 B CN112331231 B CN 112331231B CN 202011326934 A CN202011326934 A CN 202011326934A CN 112331231 B CN112331231 B CN 112331231B
Authority
CN
China
Prior art keywords
pecking
sound
broiler
broilers
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011326934.6A
Other languages
English (en)
Other versions
CN112331231A (zh
Inventor
沈明霞
刘亚楠
刘龙申
陈佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Agricultural University
Original Assignee
Nanjing Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Agricultural University filed Critical Nanjing Agricultural University
Priority to CN202011326934.6A priority Critical patent/CN112331231B/zh
Publication of CN112331231A publication Critical patent/CN112331231A/zh
Application granted granted Critical
Publication of CN112331231B publication Critical patent/CN112331231B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K45/00Other aviculture appliances, e.g. devices for determining whether a bird is about to lay
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P60/00Technologies relating to agriculture, livestock or agroalimentary industries
    • Y02P60/80Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
    • Y02P60/87Re-use of by-products of food processing for fodder production

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Environmental Sciences (AREA)
  • Birds (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于音频技术的肉鸡采食量检测系统,它包括采音室、交换机、上位机、服务器,其中:采音室用于采集肉鸡啄食音频数据;交换机用于传输肉鸡啄食音频数据;上位机连接服务器并定时读取音频数据;服务器中运行的基于单分类支持向量机OC‑SVM执行肉鸡啄食声音分类识别模型算法,将声音分为啄食声音和非啄食声音,根据功率谱密度作为声音识别特征来精准判别啄食与非啄食;基于肉鸡啄食次数与采食量关系,获得肉鸡采食量。本发明以音频检测技术为载体,通过对肉鸡进食时的啄食次数,分析确定啄食次数与采食量的关系,利用啄食次数与采食量的高相关性计算肉鸡采食量。

Description

基于音频技术的肉鸡采食量检测系统
技术领域
本发明涉及畜禽养殖、音频检测、音频识别技术领域、功率谱密度,具体地讲是一种基于音频技术的肉鸡采食量检测系统。
背景技术
肉鸡养殖业是我国畜牧业的主要组成部分,也是我国农业和农村经济的支柱产业之一,因此,肉鸡的健康状况监控就尤为重要。随着肉鸡养殖集约化、规模化的迅猛发展,改善肉鸡健康福利问题日益引起人们的重视。
在众多与肉鸡健康有关的动物行为中,采食行为是判断其生长状态以及健康状况的重要依据,采食量是其健康和生长状况的直观反映,因此准确获取采食量信息对肉鸡养殖有重要意义。然而目前肉鸡采食量数据主要是人工测定的群体采食量,人力负担重且不能准确反映个体动物的采食和健康状况,因此自动准确地测定肉鸡采食量,能够在一定程度上降低人力损耗,监控肉鸡健康状况,提升肉鸡福利。
CN109169405A公开了一种多通道肉鸡自动饲喂、采食饮水量及体重检测装备,该方案基于采食称重传感器实现采食量、肉鸡体重变化的监测。小型称重传感器的原理一般为通过弹性体(弹性元件,敏感梁)在外力作用下产生弹性变形,使粘贴在它表面的电阻应变片(转换元件)也随同产生变形,电阻应变片变形后,它的阻值将发生变化(增大或减小),再经相应的测量电路把这一电阻变化转换为电信号,完成对重力的测量,但此种传感器首先要考虑的就是传感器所处的实际工作环境,这点对正确选用称重传感器至关重要,它关系到传感器能否正常工作以及它的安全和使用寿命,乃至整个衡器的可靠性和安全性。肉鸡饲养对于空气的湿度有一定的要求,加上传感器粘贴的位置靠近采食饮水区域,湿度较大,会大大减少称重传感器的使用寿命,增加成本投入。
发明内容
本申请为了解决肉鸡饲养过程中对其采食量的智能检测问题,提供了一套基于音频技术的肉鸡采食量自动检测方法。本申请重点是分析确定啄食次数与采食量的关系,利用啄食次数与采食量的高相关性计算肉鸡采食量的算法研究。首先通过对声音信号进行分帧加窗、短时能量双门限端点检测及基于短时能量端点检测谱减法去噪的预处理,并通过功率谱密度(PSD)特性对其声音信号进行特征的提取,由于非啄食声存在的复杂性,本专利利用一种基于单分类支持向量机(One-class support vector machine,OCSVM)的肉鸡啄食声音分类识别算法将短时能量双门限端点检测后的声音转换为为一个特殊的二类问题,也就是将声音分为啄食声音和非啄食声音。再对肉鸡采食音频进行分析,可根据功率谱密度作为声音识别特征来精准判别啄食与非啄食,绘制肉鸡啄食次数与采食量关系数据表,基于音频分析绘制出肉鸡时域、频域、功率谱密度图及肉鸡啄食次数的分析图,并检测其可信度。
技术方案:
本发明公开了一种基于音频技术的肉鸡采食量检测系统,它包括采音室、交换机、上位机、服务器,其中:
采音室用于采集肉鸡啄食音频数据;
交换机用于传输肉鸡啄食音频数据;
上位机连接服务器并定时读取音频数据;
服务器中运行的基于单分类支持向量机OC-SVM执行肉鸡啄食声音分类识别模型算法,将声音分为啄食声音和非啄食声音,根据功率谱密度作为声音识别特征来精准判别啄食与非啄食;基于肉鸡啄食次数与采食量关系,获得肉鸡采食量。
优选的,所述肉鸡啄食声音分类识别模型通过以下步骤建立:
S1、设置在采音室内的拾音器采集肉鸡啄食音频数据,并传输至音频存储单元;
S2、音频存储单元接收肉鸡啄食音频数据,固定时间间隔保存;
S3、上位机固定时间间隔读取肉鸡啄食音频数据并进行分析;
S4、人工标记肉鸡啄食音频数据为啄食声音和非啄食声音,选定训练数据和测试数据;
S5、将已标记好的咳嗽声音数据进行预处理,预处理包括:预加重、滤波去噪、分帧加窗、以及端点检测;采用基于短时能量的端点检测法和更为精确地估计噪声谱的谱减法进行去噪处理;而后用Haar进行小波分解,输入Mel滤波器,进而获取改进的WMFCC特征参数即肉鸡啄食特征参数;
S6、采用单分类支持向量机OC-SVM算法,采用S5获得的WMFCC特征参数对算法进行“先验”样本训练,构建肉鸡啄食声识别模型;
S7、将测试数据引入肉鸡啄食声识别模型中进行分类识别,通过计算其成功识别样本个数所占比例,来检验识别模型的准确率;
S8、重复S5-S7,直至准确度达标,获得最终的肉鸡啄食声分类识别模型。
优选的,采音室包括摄像头、饲料槽、电子秤、拾音器,其中:摄像头固定于距离地面45cm处用来数据的读取,并通过数据线传输至音频存储单元保存;饲料槽仅为一个出料口,只支持一只肉鸡采食;饲料槽设置在电子秤的上方;拾音器固定在出料口侧面。
优选的,肉鸡啄食音频数据以16位、48kHz采样率进行记录,每隔30s保存一次声音数据,使采集的声音数据大小合适,音质较好便于后期的分析识别。
具体的,步骤S5中,预处理具体包括:
S5-1、预加重提高肉鸡声信号高频部分的分辨率,预加重传递函数如下所示:
H(z)=1-αz-1,0.9≤α≤1.0
式中:α为预加重系数,取0.98;
S5-2、分帧加窗,将声音信号分割为一帧一帧来分析其特征,设置分析帧长度为20ms,帧间重叠10ms,加汉明窗防止频谱泄露;汉明窗的表达式为:
式中,N为窗长;
S5-3、采用利用均方误差最优选择减法参数的MMSE谱减算法进行滤波去噪,谱减法公式为:
其中,表示增强后的声音信号,Y(ω)表示带噪声音谱,/>表示估计噪声谱;当p=1时为幅度谱减法,p=2时为功率谱减法;
MMSE谱减算法通过计算最小化频谱的均方误差得到最优减法参数,故纯净声音信号估计谱如下:
其中,δp对于给定的幂指数p为常数,ξ(ω)是先验信噪比;
为了防止对低能量声音段的过度抑制,设定平滑的频谱下限:
其中,为前一帧的增强谱;μ为频谱下限常数,0<μ<1;
最终的信号估计器为:
S5-4、端点检测,人工选定有效声音段:使用基于倒谱距离的端点检测;
由谱减法的通用形式得到如下公式:
式中:S(w)表示信号的能量谱密度函数;c(n)表示倒谱系数,且c(n)=c(-n),为实数;其中:
对于不同的信号S0(n)和S1(n),其倒谱距离表示为:
当肉鸡啄食音频数据的前m帧为背景噪音信号,则计算前m/2帧的倒谱系数平均值,将其作为背景噪声倒谱距离的估计值c0;然后利用上式计算其和后m/2帧的倒谱距离平均值,将其作为背景噪声倒谱距离的估计值dcepsil;其中c1(n)对应当前帧的倒谱系数,c0(n)作为c0的倒谱系数;
之后逐帧计算dc值,并利用判决门限进行判断当前帧是否为有声帧,采用动态门限的方式进行判决,设定两个门限T1和T2
Ti=dcepsil×Ki,i=1,2
式中:Ki分别为两个门限的系数,并且使K2>K1,以保证T2大于T1
采用自适应的方法对向量c0和dcepsil进行更新,更新方法如下:
c0=γc0+(1-γ)c1
dcepsil=γdcepsil+(1-γ)dc
式中:γ为更新系数;
设定有效声音段最大长度Lmax
具体的,α=0.98;当p等于1和2时,δp分别等于0.2146和0.5;μ=0.1;K1取1.5,K2取2.0;γ=0.9;Lmax=3630ms。
具体的,S5中改进的WMFCC特征参数通过下列步骤获得:
首先,将已标记好的咳嗽声音数据进行预处理,包括预加重、加窗和分帧处理;
然后用Haar小波进行小波分解,进行3层小波变换,信号的频段逐次升高;对小波系数做傅里叶变换FFT,得到不同的频谱;再根据不同的频段,将FFT结果重构,即频率合成;并将结果输入到Mel滤波器组;
最后Mel滤波器组得到Mel频率,进行DCT变换,得到基于小波变换的改进MFCC特征参数。
具体的,S7中,采用高斯混合模型-隐马尔可夫模型GMM-HMM作为识别啄食与非啄食声的声学模型,具体步骤为:
S8-1、将肉鸡啄食和非啄食2种声音样本特征用混合高斯模型GMM去模拟,其均值和方差生成观测值序列输入到HMM中,训练估计参数λ=[A,B,π],分别建立1个HMMλ;
S8-2、对每一个要识别的发声段提取其特征,经过GMM生成观测矢量序列O={O1,O2,…,Om};
S8-3、求O在每个HMMλ模型下的概率P(O/λ),选择得分最高的模型对应的声音作为识别结果。
具体的,肉鸡啄食次数的计算具体步骤为:
将肉鸡啄食声音设为目标样本s={xi,i=1,2,...,N},通过非线性映射函数Φ将样本数据映射到高维特征空间,最优超平面与坐标原点的最大距离为λ为支持向量的权重,ρ为阈值;通过二次规划问题可得:
式中,N为目标样本的数量;v为平衡参数,用以控制支持向量在目标样本中所占比例;ξ为目标函数的惩罚系数;决策函数为:
式中,K(xi,xj)为核函数;αi、αj为拉格朗日乘数;
当f(x)>0时,则该样本为正样本即啄食声音,否则属于非啄食声音,以此判断计算啄食次数。
具体的,通过啄食次数获取啄食量,肉鸡日龄和肉鸡啄食量关系见下表:
本发明的有益效果
本申请以音频检测技术为载体,获得肉鸡进食时的啄食次数,通过实验分析确定啄食次数与采食量的关系,利用啄食次数与采食量的高相关性计算肉鸡采食量。避免了目前我国肉鸡采食量数据主要是人工测量群体采食量的现状;同时该方案相较于称重传感器监测的方案,避免了高湿度环境下称重传感器中采样电阻阻值的误差干扰,精准性更高。
本申请对肉鸡采食量进行检测,在完全脱离养殖人员的情况下,对肉鸡采食量进行高精度的测量,有助于养殖人员根据检测数据,计算肉鸡料肉比,科学合理规划下料量,做到收益最大化。
本申请采用融合了MFCC,得到基于小波变换的改进WMFCC特征参数,搭建基于GMM-HMM的肉鸡啄食与非啄食的识别检测算法模型,可以显著的提高肉鸡啄食与非啄食识别率,进而通过算法计算肉鸡采食量。
附图说明
图1为本发明的肉鸡采食量检测系统示意图
图2为本发明的采音室结构示意图
图3为本发明的端点检测中倒谱提取流程图
图4为本发明的端点检测流程图
图5为本发明的肉鸡啄食声识别中WMFCC提取流程图
图6为实施例中肉鸡3次采食试验的采食量与啄食次数数据及分析结果示意图
图7为本发明的应用端系统架构图
图8为本发明的肉鸡采食量检测系统框架图
具体实施方式
下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:
结合图1,本发明的肉鸡采食量检测系统,它包括采音室、交换机、上位机、服务器,其中:
采音室用于采集肉鸡啄食音频数据;
交换机用于传输肉鸡啄食音频数据并存储;
上位机连接服务器并定时读取音频数据;
服务器中运行的基于单分类支持向量机OC-SVM执行肉鸡啄食声音分类识别模型算法,将声音分为啄食声音和非啄食声音,根据功率谱密度作为声音识别特征来精准判别啄食与非啄食;基于肉鸡啄食次数与采食量关系,获得肉鸡采食量。
结合图2,采音室包括摄像头1、饲料槽2、电子秤3、拾音器4,其中:摄像头1固定于距离地面45cm处用来数据的读取,并通过数据线传输至音频存储单元保存;饲料槽2仅为一个出料口,只支持一只肉鸡采食;饲料槽2设置在电子秤3的上方;拾音器4固定在出料口侧面。在试验开始之前,每只肉鸡中断供给食物和水4h,以便在试验时促进采食行为,采用的饲料为谷物混合颗粒饲料。在存储单元设置每隔30s保存一次肉鸡声音数据,音频存储单元与上位机通过USB数据线相连;在上位机中设置音频读取接口,定时读取存储单元里的音频数据,识别主程序对读取的音频数据进行预处理(滤波去噪、分帧加窗、端点检测);人工识别选取音频中鸡只啄食与非啄食的时间段,对两种时间段内的肉鸡音频数据进行特征提取,采用OC-SVM分类识别算法训练决策模型;肉鸡声音在经过模型分类后通过分析得出肉鸡的采食量并传输给上位机。肉鸡啄食声音分类识别模型通过以下步骤建立:
S1、设置在采音室内的拾音器采集肉鸡啄食音频数据,并传输至音频存储单元;
S2、音频存储单元接收肉鸡啄食音频数据,固定时间间隔保存;
S3、上位机固定时间间隔读取肉鸡啄食音频数据并进行分析;
S4、人工标记肉鸡啄食音频数据为啄食声音和非啄食声音,选定训练数据和测试数据;
S5、将已标记好的咳嗽声音数据进行预处理,预处理包括:预加重、滤波去噪、分帧加窗、以及端点检测;采用基于短时能量的端点检测法和更为精确地估计噪声谱的谱减法进行去噪处理;而后用Haar进行小波分解,输入Mel滤波器,进而获取改进的WMFCC特征参数即肉鸡啄食特征参数;
S6、采用单分类支持向量机OC-SVM算法,采用S5获得的WMFCC特征参数对算法进行“先验”样本训练,构建肉鸡啄食声识别模型;
S7、将测试数据引入肉鸡啄食声识别模型中进行分类识别,通过计算其成功识别样本个数所占比例,来检验识别模型的准确率;
S8、重复S5-S7,直至准确度达标,获得最终的肉鸡啄食声分类识别模型。
肉鸡采食量检测系统具体设计方案如下:
(1)肉鸡咳嗽声音的采集
采音室外壁采用隔音材料,以尽力减少外部噪声(人的活动声,环境噪声等)对采集声音源的干扰;内壁采用吸音材料,以减少采音室内的回声干扰。摄像头1固定于距离地面45cm处用来数据的读取,采集鸡只编号及电子秤示数,过低可能会造成肉鸡对电子秤示数的遮挡,过高又会影响电子秤示数的清晰度。拾音器贴在出料口侧面,不易被肉鸡啄食,还能更大程度上保证声音数据的保真度。
(2)数据的传输与存储
肉鸡发声感知系统的准确传输的能力至关重要。本申请采用的以太网标准TCP/IP协议,具有通信可靠、传输速度快、远距离传输和适配多种传输介质等优点。网络拾音器通过以太网连接到交换机,所有拾音器的数据经由交换机传输到服务器固定区域,交换机和服务器通过光纤连接,保证了数据的实时性和安全性。数据传输到服务器后,在监控端通过设备管理平台调用系统服务来展示数据,设备管理平台和服务器要保证在同一局域网中。这里所有声音以16位、48kHz采样率进行记录,每隔30s保存一次声音数据,使采集的声音数据大小合适,音质较好便于后期的分析识别。摄像机镜头从侧面指向喂食器,视频数据以每秒25帧的采样率,2 048×1 536的图像尺寸录制,录制期间光线保持恒定。
(3)肉鸡声音数据预处理
本申请中对肉鸡声音的预处理主要包括:
1、预加重:对肉鸡的声音信号进行采集时,通风设施、调温设施、喂料设备的使用及工作人员移动使采集到的肉鸡啄食声音包含大量的无用信息与干扰数据,需经过预处理将其剔除以提取出有效声音信息。在对肉鸡声信号进行处理之前,需对肉鸡声信号进行预加重。预加重可以提高肉鸡声信号高频部分的分辨率,传递函数如下所示:
H(z)=1-αz-1,0.9≤α≤1.0
式中:α为预加重系数,本文取0.98。
2、分帧加窗:动物发声是十分复杂的非平稳信号,但一般认为在10~30ms内声音信号特性基本不变或变化缓慢,因此可以将声音信号分割为一帧一帧来分析其特征。本申请设置分析帧长度为20ms,帧间重叠10ms,加汉明窗防止频谱泄露。汉明窗的表达式为:
式中:N为窗长。
3、滤波去噪:本申请采用利用均方误差最优选择减法参数的MMSE谱减算法。谱减法的通用形式为:
其中表示增强后的声音信号,Y(ω)表示带噪声音谱,/>表示估计噪声谱。当p=1时为幅度谱减法,p=2时为功率谱减法。MMSE谱减算法通过计算最小化频谱的均方误差得到最优减法参数,进而推出纯净声音信号估计谱/>如下:
其中,δp对于给定的幂指数p为常数(当p等于1和2时,δp分别等于0.2146和0.5),ξ(ω)是先验信噪比。为了防止对低能量声音段的过度抑制,采用一个谱下限。通过对衰减后的带噪声音谱μY(ω)(0<μ<1)和前一帧增强且平滑后的声音谱进行平均,可以得到平滑的频谱下限:
其中为前一帧的增强谱。如果式(3-4)增强后的频谱值小于μY(ω),则将其设为/>最终的信号估计器为:
上式中μ为频谱下限常数,本申请设为0.1。
4、端点检测:本专利使用基于倒谱距离的端点检测。倒谱在定义上是对信号傅里叶变换后经对数运算后再进行傅里叶反变换得到的谱,它的计算流程如图3所示。
由谱减法的通用形式可以得到如下公式:
式中:c(n)表示倒谱系数,且c(n)=c(-n),为实数。其中:
根据Parseval定理,对于两个不同信号S0(n)和S1(n),其倒谱距离表示为:
式中:c0(n)和c1(n)分别对应S0(w)和S1(w)的倒谱系数。上式可以近似为:
在利用倒谱距离进行端点检测时本专利假定音频数据的前10帧为背景噪音信号,计算前5帧的倒谱系数平均值,将其作为背景噪声倒谱距离的估计值c0,然后利用式上式计算和后5帧的倒谱距离平均值,将其作为背景噪声倒谱距离的估计值dcepsil,其中c1(n)对应当前帧的倒谱系数,c0(n)作为c0的倒谱系数。之后逐帧计算dc值,并利用判决门限进行判断当前帧是否为有声帧,采用动态门限的方式进行判决,设定两个门限T1和T2
Ti=dcepsil×Ki,i=1,2
式中:Ki分别为两个门限的系数,并且使K2>K1,以保证T2大于T1,本申请经过多次实验K1取1.5,K2取2.0。同时因为背景噪声变化无规律,因此采用自适应的方法对向量c0和dcepsil进行更新,更新方法如下:
c0=γc0+(1-γ)c1
dcepsil=γdcepsil+(1-γ)dc
式中:γ为更新系数,本申请取0.9。同时为了防止截取声音段过长,减少误判的情况发生,基于时长统计分析,设定有效声音段最大长度Lmax=3630ms。确定有声段起点和终点的具体过程如图4所示。
(4)肉鸡啄食声的识别
(1)特征提取:本申请使用基于小波变化的梅尔倒谱系数特征,在提取MFCC特征之前,用离散小波变换代替傅里叶变换进行音频信号处理,对采集到的信号进行预加重、加窗和分帧处理后用Haar小波进行小波分解,对分层后的数据做FFT并合成,并将结果输入Mel滤波器组得到Mel频率最终得到基于小波变换的改进MFCC特征参数。WMFCC特征参数提取流程如图5所示。
(2)分类识别:因肉鸡自身因为个体差异及环境变换因素,肉鸡啄食的时长及波形具有一定差异性,且经过特征提取后特征参数维数不同,本专利采用高斯混合模型-隐马尔可夫模型(GMM-HMM)作为识别啄食与非啄食声的声学模型。在对肉鸡声信号进行特征提取后,使用GMM进行特征聚类,HMM作为分类器,搭建基于GMM-HMM的肉鸡啄食与非啄食的识别检测算法模型。
1)将肉鸡啄食和非啄食2种声音样本特征用混合高斯模型(GMM)去模拟,其均值和方差生成观测值序列输入到HMM中,训练估计参数λ=[A,B,π],分别建立1个HMMλ;
2)对每一个要识别的发声段提取其特征,经过GMM生成观测矢量序列O={O1,O2,…,Om};
3)求O在每个HMMλ模型下的概率P(O/λ),选择得分最高的模型对应的声音作为识别结果。
(5)啄食次数计算
将肉鸡啄食声音设为目标样本s={xi,i=1,2,...,N},通过非线性映射函数Φ将样本数据映射到高维特征空间,最优超平面与坐标原点的最大距离为λ为支持向量的权重,ρ为阈值。通过二次规划问题可得:
式中,N为目标样本的数量;v为平衡参数,用以控制支持向量在目标样本中所占比例;ξ为目标函数的惩罚系数。因此决策函数为:
此时再引入拉格朗日乘子,将上述问题转变为对偶问题:
式中,K(xi,xj)为核函数;αi、αj为拉格朗日乘数。求解上式可得最终决策函数:
对于待测样本而言,当f(x)>0时,则该样本为正样本即啄食声音,否则属于非啄食声音,以此判断计算啄食次数。
(6)啄食量计算
申请人经研究发现,肉鸡啄食量与肉鸡鸡龄、啄食次数存在关联。
表1和图6给出了每只40日龄肉鸡3次采食试验的啄食次数和采食量数据,进一步对比分析每次试验累积啄食次数与累积采食量数据,累积啄食次数与累积采食量对比分析图,很明显看出两者具有很强的线性关系。
表1肉鸡啄食与采食量数据
图2中展示出每次实验啄食次数与采食量的线性拟合结果R2=0.9825,说明可以通过啄食次数获取啄食量,40日龄肉鸡一次啄食的采食量为0.027g。
对不同鸡龄的肉鸡重复试验,获得肉鸡日龄和肉鸡啄食量关系见下表:
(7)服务器程序设计
服务器程序主要负责接受存储移动终端传送的数据,对上传的数据信息进行预处理和特征提取,再用GMM-HMM对数据进行啄食与非啄食的数据分类,进而获取肉鸡采食量,帮助饲养员智能评估肉鸡健康状况。
肉鸡啄食与非啄食监测应用端系统是肉鸡发声实时感知肉鸡啄食检测与Web监测预警平台三个部分有序结合构成的整体。肉鸡发声实时感知系统通过网络拾音器及TCP/IP网络传输协议,实时采集鸡舍内肉鸡发声数据信息并存入服务器固定文件存储区域;肉鸡啄食检测系统从文件存储区及时读取肉鸡声音数据并进行快速准确的实时检测,检测结果送入数据库变为持久化数据;Web监测预警平台实时读取数据库中的最新数据,展示给养殖管理人员。应用端系统架构设计如图7所示。
(8)肉鸡采食量检测软件系统的设计
基于Web客户端搭建肉鸡采食量检测软件,有利于鸡场工作人员直观、准确地记录统计肉鸡每日采食量,并根据肉鸡日、月增重和采食量计算出本批肉鸡料肉比。结合图8,软件系统设计主要包括三个部分:中间件设计、数据库设计以及Web客户端设计,分别对应数据处理、数据存储以及数据展示,三部分的有序结合构成了监测系统软件整体。功能说明:
(1)中间件的采集与滤波
肉鸡在采音室进行啄食时,拾音器采集音频信息。采音室提供了一个较为安静理想的声源采集场所,但依旧会受到部分肉鸡咳嗽、扇翅等噪音的影响,因此对音频的第一步操作是进行声音滤波,滤除噪音。
(2)数据的传输存储
拾音器与存储单元、存储单元与上位机均通过有线方式连接。拾音器收集到的音频信息上传至数据库。
(3)啄食声识别监测
上位机通过接收到的音频数据,对数据处理,建立啄食与非啄食声音特征模型,采用上述的算法将肉鸡啄食与非啄食音频信息进行分类,识别出啄食音频,并由上位机对存储的数据进行操作处理和Web端App的展示。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (7)

1.一种基于音频技术的肉鸡采食量检测系统,其特征在于它包括采音室、交换机、上位机、服务器,其中:
采音室用于采集肉鸡啄食音频数据;
交换机用于传输肉鸡啄食音频数据;
上位机连接服务器并定时读取音频数据;
服务器中运行的基于单分类支持向量机OC-SVM执行肉鸡啄食声音分类识别模型算法,将声音分为啄食声音和非啄食声音,根据功率谱密度作为声音识别特征来精准判别啄食与非啄食;基于肉鸡啄食次数与采食量关系,获得肉鸡采食量;
所述肉鸡啄食声音分类识别模型通过以下步骤建立:
S1、设置在采音室内的拾音器采集肉鸡啄食音频数据,并传输至音频存储单元;
S2、音频存储单元接收肉鸡啄食音频数据,固定时间间隔保存;
S3、上位机固定时间间隔读取肉鸡啄食音频数据并进行分析;
S4、人工标记肉鸡啄食音频数据为啄食声音和非啄食声音,选定训练数据和测试数据;
S5、将已标记好的咳嗽声音数据进行预处理,预处理包括:预加重、滤波去噪、分帧加窗、以及端点检测;采用基于短时能量的端点检测法和更为精确地估计噪声谱的谱减法进行去噪处理;而后用Haar进行小波分解,输入Mel滤波器,进而获取改进的WMFCC特征参数即肉鸡啄食特征参数;
预处理具体包括:
S5-1、预加重提高肉鸡声信号高频部分的分辨率,预加重传递函数如下所示:
H(z)=1-αz-1,0.9≤α≤1.0
式中:α为预加重系数,取0.98;α=0.98;当p等于1和2时,δp分别等于0.2146和0.5;μ=0.1;K1取1.5,K2取2.0;γ=0.9;Lmax=3630ms;
S5-2、分帧加窗,将声音信号分割为一帧一帧来分析其特征,设置分析帧长度为20ms,帧间重叠10ms,加汉明窗防止频谱泄露;汉明窗的表达式为:
式中,N为窗长;
S5-3、采用利用均方误差最优选择减法参数的MMSE谱减算法进行滤波去噪,谱减法公式为:
其中,表示增强后的声音信号,Y(ω)表示带噪声音谱,/>表示估计噪声谱;当p=1时为幅度谱减法,p=2时为功率谱减法;
MMSE谱减算法通过计算最小化频谱的均方误差得到最优减法参数,故纯净声音信号估计谱如下:
其中,δp对于给定的幂指数p为常数,ξ(ω)是先验信噪比;
为了防止对低能量声音段的过度抑制,设定平滑的频谱下限:
其中,为前一帧的增强谱;μ为频谱下限常数,0<μ<1;
最终的信号估计器为:
S5-4、端点检测,人工选定有效声音段:使用基于倒谱距离的端点检测;
由谱减法的通用形式得到如下公式:
式中:S(w)表示信号的能量谱密度函数;c(n)表示倒谱系数,且c(n)=c(-n),为实数;其中:
对于不同的信号S0(n)和S1(n),其倒谱距离表示为:
当肉鸡啄食音频数据的前m帧为背景噪音信号,则计算前m/2帧的倒谱系数平均值,将其作为背景噪声倒谱距离的估计值c0;然后利用上式计算其和后m/2帧的倒谱距离平均值,将其作为背景噪声倒谱距离的估计值dcepsil;其中c1(n)对应当前帧的倒谱系数,c0(n)作为c0的倒谱系数;
之后逐帧计算dc值,并利用判决门限进行判断当前帧是否为有声帧,采用动态门限的方式进行判决,设定两个门限T1和T2
Ti=dcepsil×Ki,i=1,2
式中:Ki分别为两个门限的系数,并且使K2>K1,以保证T2大于T1
采用自适应的方法对向量c0和dcepsil进行更新,更新方法如下:
c0=γc0+(1-γ)c1
dcepsil=γdcepsil+(1-γ)dc
式中:γ为更新系数;
设定有效声音段最大长度Lmax
S6、采用单分类支持向量机OC-SVM算法,采用S5获得的WMFCC特征参数对算法进行“先验”样本训练,构建肉鸡啄食声识别模型;
S7、将测试数据引入肉鸡啄食声识别模型中进行分类识别,通过计算其成功识别样本个数所占比例,来检验识别模型的准确率;
S8、重复S5-S7,直至准确度达标,获得最终的肉鸡啄食声分类识别模型。
2.根据权利要求1所述的系统,其特征在于采音室包括摄像头(1)、饲料槽(2)、电子秤(3)、拾音器(4),其中:摄像头(1)固定于距离地面45cm处用来数据的读取,并通过数据线传输至音频存储单元保存;饲料槽(2)仅为一个出料口,只支持一只肉鸡采食;饲料槽(2)设置在电子秤(3)的上方;拾音器(4)固定在出料口侧面。
3.根据权利要求1所述的系统,其特征在于肉鸡啄食音频数据以16位、48kHz采样率进行记录,每隔30s保存一次声音数据,使采集的声音数据大小合适,音质较好便于后期的分析识别。
4.根据权利要求1所述的系统,其特征在于S5中改进的WMFCC特征参数通过下列步骤获得:
首先,将已标记好的咳嗽声音数据进行预处理,包括预加重、加窗和分帧处理;
然后用Haar小波进行小波分解,进行3层小波变换,信号的频段逐次升高;对小波系数做傅里叶变换FFT,得到不同的频谱;再根据不同的频段,将FFT结果重构,即频率合成;并将结果输入到Mel滤波器组;
最后Mel滤波器组得到Mel频率,进行DCT变换,得到基于小波变换的改进MFCC特征参数。
5.根据权利要求1所述的系统,其特征在于S7中,采用高斯混合模型-隐马尔可夫模型GMM-HMM作为识别啄食与非啄食声的声学模型,具体步骤为:
S8-1、将肉鸡啄食和非啄食2种声音样本特征用混合高斯模型GMM去模拟,其均值和方差生成观测值序列输入到HMM中,训练估计参数λ=[A,B,π],分别建立1个HMMλ;
S8-2、对每一个要识别的发声段提取其特征,经过GMM生成观测矢量序列O={O1,O2,…,Om};
S8-3、求O在每个HMMλ模型下的概率P(O/λ),选择得分最高的模型对应的声音作为识别结果。
6.根据权利要求1所述的系统,其特征在于肉鸡啄食次数的计算具体步骤为:
将肉鸡啄食声音设为目标样本s={xi,i=1,2,...,N},通过非线性映射函数Φ将样本数据映射到高维特征空间,最优超平面与坐标原点的最大距离为λ为支持向量的权重,ρ为阈值;通过二次规划问题可得:
式中,N为目标样本的数量;v为平衡参数,用以控制支持向量在目标样本中所占比例;ξ为目标函数的惩罚系数;决策函数为:
式中,K(xi,xj)为核函数;αi、αj为拉格朗日乘数;
当f(x)>0时,则该样本为正样本即啄食声音,否则属于非啄食声音,以此判断计算啄食次数。
7.根据权利要求1所述的系统,其特征在于通过啄食次数获取啄食量,肉鸡日龄和肉鸡啄食量关系见下表:
CN202011326934.6A 2020-11-24 2020-11-24 基于音频技术的肉鸡采食量检测系统 Active CN112331231B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011326934.6A CN112331231B (zh) 2020-11-24 2020-11-24 基于音频技术的肉鸡采食量检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011326934.6A CN112331231B (zh) 2020-11-24 2020-11-24 基于音频技术的肉鸡采食量检测系统

Publications (2)

Publication Number Publication Date
CN112331231A CN112331231A (zh) 2021-02-05
CN112331231B true CN112331231B (zh) 2024-04-19

Family

ID=74321122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011326934.6A Active CN112331231B (zh) 2020-11-24 2020-11-24 基于音频技术的肉鸡采食量检测系统

Country Status (1)

Country Link
CN (1) CN112331231B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113192322B (zh) * 2021-03-19 2022-11-25 东北大学 一种基于云边协同的高速公路交通流量计数方法
CN113207722B (zh) * 2021-03-30 2023-04-11 广州朗国电子科技股份有限公司 人工智能用农牧业自动投料方法、设备以及介质
CN115104548B (zh) * 2022-07-11 2022-12-27 深圳市前海远为科技有限公司 基于多媒体信息技术的宠物行为调整和人宠互动方法及装置
CN117562022B (zh) * 2024-01-09 2024-04-02 博罗县石坝乌坭湖思源养殖有限公司 一种基于家禽生长状态反馈调整的投饲方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151571A (en) * 1999-08-31 2000-11-21 Andersen Consulting System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters
KR20080077880A (ko) * 2007-02-21 2008-08-26 인하대학교 산학협력단 피치 특징 벡터와 서포트 벡터머신을 이용한 음성신호에기초한 성별 인식 방법
CN109243470A (zh) * 2018-08-16 2019-01-18 南京农业大学 基于音频技术的肉鸡咳嗽监测方法
WO2019023879A1 (zh) * 2017-07-31 2019-02-07 深圳和而泰智能家居科技有限公司 咳嗽声音识别方法、设备和存储介质
CN110033787A (zh) * 2018-01-12 2019-07-19 英特尔公司 触发视频分析的音频事件
CN110120224A (zh) * 2019-05-10 2019-08-13 平安科技(深圳)有限公司 鸟声识别模型的构建方法、装置、计算机设备及存储介质
CN110444230A (zh) * 2019-07-04 2019-11-12 南京农业大学 一种基于音频技术的肉鸡呼吸道疾病自动识别装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201305725D0 (en) * 2013-03-28 2013-05-15 Univ Leuven Kath Automated monitoring of animal nutriment ingestion
CN103236260B (zh) * 2013-03-29 2015-08-12 京东方科技集团股份有限公司 语音识别系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151571A (en) * 1999-08-31 2000-11-21 Andersen Consulting System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters
KR20080077880A (ko) * 2007-02-21 2008-08-26 인하대학교 산학협력단 피치 특징 벡터와 서포트 벡터머신을 이용한 음성신호에기초한 성별 인식 방법
WO2019023879A1 (zh) * 2017-07-31 2019-02-07 深圳和而泰智能家居科技有限公司 咳嗽声音识别方法、设备和存储介质
CN110033787A (zh) * 2018-01-12 2019-07-19 英特尔公司 触发视频分析的音频事件
CN109243470A (zh) * 2018-08-16 2019-01-18 南京农业大学 基于音频技术的肉鸡咳嗽监测方法
CN110120224A (zh) * 2019-05-10 2019-08-13 平安科技(深圳)有限公司 鸟声识别模型的构建方法、装置、计算机设备及存储介质
CN110444230A (zh) * 2019-07-04 2019-11-12 南京农业大学 一种基于音频技术的肉鸡呼吸道疾病自动识别装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于音频技术的白羽肉鸡咳嗽识别算法研究;秦伏亮 等;南京农业大学学报(02);372-378 *
基于音频技术的肉鸡采食量检测方法研究;杨稷 等;华南农业大学学报(第05期);118-124 *
杨稷 等. 基于音频技术的肉鸡采食量检测方法研究.华南农业大学学报.2018,(第05期),118-124. *

Also Published As

Publication number Publication date
CN112331231A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
CN112331231B (zh) 基于音频技术的肉鸡采食量检测系统
CN109258509B (zh) 一种生猪异常声音智能监测系统与方法
CN109243470B (zh) 基于音频技术的肉鸡咳嗽监测方法
Milone et al. Automatic recognition of ingestive sounds of cattle based on hidden Markov models
CA2125095C (en) Automated intelligent monitoring system
CN108198562A (zh) 一种用于实时定位辨识动物舍内异常声音的方法及系统
Sueur et al. Global estimation of animal diversity using automatic acoustic sensors
CN110580916B (zh) 体重声学测量模型的创建方法与体重测量方法、装置
CN112164408A (zh) 基于深度学习的猪咳嗽声监测与预警系统
CN111583962A (zh) 一种基于声学分析的羊反刍行为监测方法
CN110265041A (zh) 一种收集、分析猪的发声行为的方法和系统
CN111916089B (zh) 基于声信号特征分析的冰雹检测方法和装置
CN115618205A (zh) 一种便携式声纹故障检测系统及方法
CN115048984A (zh) 一种基于深度学习的母猪发情声识别方法
Sheng et al. Construction of sheep forage intake estimation models based on sound analysis
CN115876258A (zh) 基于多源数据的畜禽养殖环境异常监测及报警系统
CN113397494A (zh) 动物体征监测装置和方法及智能可穿戴装置
Duan et al. Short-term feeding behaviour sound classification method for sheep using LSTM networks
CN115410711A (zh) 基于声音信号特征和随机森林的白羽肉鸡健康监测方法
Rau et al. Developments on real-time monitoring of grazing cattle feeding behavior using sound
Xie et al. Detecting frog calling activity based on acoustic event detection and multi-label learning
Rougui et al. Audio sound event identification for distress situations and context awareness
Fontana et al. Frequency analysis of vocalisations in relation to the growth in broiler chicken
Martinez-Rau et al. A noise-robust acoustic method for recognizing foraging activities of grazing cattle
CN115420356B (zh) 一种成年鸽性别的鉴定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant