CN110689898A - 用于生猪的音频信号的压缩方法及系统 - Google Patents

用于生猪的音频信号的压缩方法及系统 Download PDF

Info

Publication number
CN110689898A
CN110689898A CN201911128880.XA CN201911128880A CN110689898A CN 110689898 A CN110689898 A CN 110689898A CN 201911128880 A CN201911128880 A CN 201911128880A CN 110689898 A CN110689898 A CN 110689898A
Authority
CN
China
Prior art keywords
audio signal
audio
signal
processing
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911128880.XA
Other languages
English (en)
Inventor
吴亚文
何屿彤
焦俊
张双龙
孙裴
辜丽川
张锋
邵睿
李斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Acquisitive Internet Of Things Co Ltd
Anhui Agricultural University AHAU
Original Assignee
Anhui Acquisitive Internet Of Things Co Ltd
Anhui Agricultural University AHAU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Acquisitive Internet Of Things Co Ltd, Anhui Agricultural University AHAU filed Critical Anhui Acquisitive Internet Of Things Co Ltd
Priority to CN201911128880.XA priority Critical patent/CN110689898A/zh
Publication of CN110689898A publication Critical patent/CN110689898A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施方式提供一种用于生猪的音频信号的压缩方法及系统,属于音频信号的压缩传输技术领域。所述压缩方法包括:获取所述音频信号;将所述音频信号转换为数字信号模式;对所述音频信号进行加重处理;对加重处理后的所述音频信号执行归一化操作;对归一化操作后的所述音频信号进行加窗分帧处理;对加窗分帧处理后的所述音频信号进行端点检测以确定所述音频信号的有效信号部分;提取所述有效信号部分以作为预处理后的所述音频信号;采用谱减法压缩预处理后的所述音频信号。该压缩传输方法及系统能够解决现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题。

Description

用于生猪的音频信号的压缩方法及系统
技术领域
本发明涉及音频信号的压缩传输技术领域,具体地涉及一种用于生猪的音频信号的压缩方法及系统。
背景技术
生猪声音信息可以作为识别健康与否的依据,因此基于多媒体传感网的生猪音频信息采集和传输是需要解决的主要问题,同时音频信息也反映生猪健康状况,交流和表达情感的重要途径。但是在多媒体WSN中,声音传输时会出现的信息碰撞和拥塞问题,因此需要通过压缩感知技术对生猪音频信号进行处理。
发明内容
本发明实施方式的目的是提供一种用于生猪的音频信号的压缩方法及系统,该压缩传输方法及系统能够解决现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题。
为了实现上述目的,本发明实施方式提供一种用于生猪的音频信号的压缩方法,所述压缩方法可以包括:
获取所述音频信号;
将所述音频信号转换为数字信号模式;
对所述音频信号进行加重处理;
对加重处理后的所述音频信号执行归一化操作;
对归一化操作后的所述音频信号进行加窗分帧处理;
对加窗分帧处理后的所述音频信号进行端点检测以确定所述音频信号的有效信号部分;
提取所述有效信号部分以作为预处理后的所述音频信号;
采用谱减法压缩预处理后的所述音频信号。
可选地,所述加重处理的传递函数为公式(1),
H(z)=1-αz-1, (1)
其中,H(z)为高通滤波器的所述传递函数,z为对所述音频信号进行处理过程中的变化z域,α为预加重系数;
所述加重处理包括:
根据公式(2)执行所述加重处理,
s(n)=x(n)-αx(n-1), (2)
其中,s(n)为加重处理后的音频信号,x(n)为所述音频信号的n时刻的语音采样值,x(n-1)为所述音频信号的n-1时刻的语音采样值。
可选地,所述加窗分帧处理包括:
根据公式(3)和公式(4)处理所述音频信号,
q=s(n)*w(n), (3)
Figure BDA0002277719180000021
其中,q为加窗分帧处理后的所述音频信号,s(n)为加窗分帧处理前的所述音频信号,w(n)为汉明窗函数,N为所述汉明窗函数的窗长。
可选地,所述端点检测包括:
根据公式(5)至公式(6)确定所述音频信号的有效信号部分,
Figure BDA0002277719180000022
其中,En为所述音频信号的短时能量,M为所述音频信号的帧数,qn为所述音频信号的第n帧;
Figure BDA0002277719180000023
其中,Zn为所述音频信号的平均过零率,qn为所述音频信号的第n帧,M为所述音频信号的帧数。
可选地,所述谱减法包括:
采用公式(7)至公式(13)对所述音频信号进行稀疏化操作,
y(n)=q(n)+d(n), (7)
其中,y(n)为带有噪音的音频信号Y(n)的第n帧,q(n)为所述音频信号中的纯净部分,d(n)为所述音频信号中的噪音部分D(n)的第n帧;
Figure BDA0002277719180000031
其中,Y(ω)为带有噪音的音频信号Y(n)的极坐标形式,|Y(ω)|为对应的幅度谱,
Figure BDA0002277719180000032
为带有噪音的音频信号Y(n)的相位谱,
Figure BDA0002277719180000033
为音频信号Y(n)的相位,
Figure BDA0002277719180000034
其中,D(ω)为所述音频信号中的噪音部分D(n)极坐标形式,|D(ω)|为对应的幅度谱,
Figure BDA0002277719180000035
为噪音部分D(n)的相位谱,
Figure BDA0002277719180000036
为噪音部分D(n)的相位,
Figure BDA0002277719180000037
其中,f(ω)为所述音频信号的极坐标形式,Y(ω)为带有噪音的音频信号Y(n)的极坐标形式,
Figure BDA0002277719180000038
为D(ω)的估计值,
Figure BDA0002277719180000039
为带有噪音的音频信号Y(n)的相位谱,
Figure BDA00022777191800000310
为音频信号Y(n)的相位,
Figure BDA00022777191800000311
Figure BDA00022777191800000312
其中,F(k)为所述音频信号f的DCT变换,f(i)为所述音频信号f的第i帧,n为所述音频信号f的帧数,
F=α·f, (13)
其中,F为稀疏化处理后的所述音频信号,α为标准正交基,f为稀疏化处理前的所述音频信号;
根据公式(14)至公式(16)构建所述音频信号的观测矩阵以得到压缩后的所述音频信号,
Figure BDA0002277719180000041
M≥cKlog(N/K)<<N, (15)
其中,ε∈(0,1),θ为M×N的预设的测量矩阵,F为稀疏化处理后的所述音频信号,K为稀疏度的值,α为标准正交基,f为稀疏化处理前的所述音频信号,A为所述观测矩阵,
Figure BDA0002277719180000043
为传感矩阵。
另一方面,本发明还提供一种用于音频信号的压缩系统,所述压缩系统包括处理器,所述处理器用于执行如上述任一所述的压缩方法。
另一方面,本发明还提供一种用于生猪的音频信号的传输方法,所述传输方法包括:
采用如上述任一所述的压缩方法压缩所述音频信号;
接收端接收所述音频信号,并采用公式(17)至公式(21)对所述音频信号进行重构以得到解码后的所述音频信号,
A=argmin||θ·F||0s.t.A=θ·F, (17)
其中,s.t.为表示受限于,A为所述观测矩阵,θ为测量矩阵,F为稀疏化处理后的所述音频信号,
Figure BDA0002277719180000044
Figure BDA0002277719180000045
Figure BDA0002277719180000046
其中,λt为第t次迭代找到的索引,N为测量矩阵θ的元素的个数,rt-1为t=t-1时的残差,为传感矩阵φ的第j列,∧t为t次迭代的索引的集合,∧t-1为t-1次迭代的索引的集合,φt为第t次迭代的传感矩阵φ的重建原子集合,φt-1为第t-1次迭代的传感矩阵φ的重建原子集合,
Figure BDA0002277719180000052
为传感矩阵的第λt列,
Figure BDA0002277719180000053
为音频信号F的稀疏逼近值,为第t次迭代的音频信号值,rt为解码后的残差更新的值。
可选地,所述传输方法包括预设音频采集系统以获取所述音频信号,其中,所述音频采集系统包括:
音频采集节点,设置于现场,用于采集所述音频信号;
第一处理器,用于执行如权利要求1至5任一所述的压缩方法;
通信装置,用于传输压缩后的所述音频信号;
终端,用于接收所述音频信号并采用公式(17)至公式(21)解码所述音频信号。
再一方面,本发明还提供一种用于生猪的音频信号的传输系统,所述传输系统包括处理器,所述处理器用于执行如上述所述的传输方法。
再一方面,本发明还提供一种存储介质,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如上述任一所述的方法。
通过上述技术方案,本发明提供的用于生猪的音频信号的压缩方法及系统通过对音频信号依次进行转换、加重、归一化操作、加窗分帧处理以得到音频信号中的有效信号部分,再采用谱减法对该有效部分进行压缩,解决了现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题。本发明提供的用于生猪的音频信号的传输方法及系统通过采用上述压缩方法及系统克服了现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题,提高了音频信号的传输效率和准确度。
本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施方式的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施方式,但并不构成对本发明实施方式的限制。在附图中:
图1是根据本发明的一个实施方式的用于生猪的音频信号的传输方法的流程图;
图2是根据本发明的一个实施方式的高通滤波器的幅频特性图;
图3是根据本发明的一个实施方式的高通滤波器的相频特性图;
图4是根据本发明的一个实施方式的音频信号经过高通滤波器处理前后的时域波形图;
图5是根据本发明的一个实施方式的音频信号经过高通滤波器处理前后的频谱变化图;
图6是根据本发明的一个实施方式的汉明窗函数时域波形图以及汉明窗函数幅度特性图;
图7是根据本发明的一个示例的短时能量平均过零率的对照波形图;以及
图8是根据本发明的一个实施方式的谱减法的流程图。
具体实施方式
以下结合附图对本发明实施方式的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施方式,并不用于限制本发明实施方式。
在本发明实施方式中,在未作相反说明的情况下,使用的方位词如“上、下、顶、底”通常是针对附图所示的方向而言的或者是针对竖直、垂直或重力方向上而言的各部件相互位置关系描述用词。
另外,若本发明实施方式中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施方式之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
如图1所示是根据本发明的一个实施方式的用于生猪的音频信号的压缩方法的流程图。在图1中,该压缩方法可以包括:
在步骤S10中,获取音频信号。在该实施方式中,获取该音频信号的频率可以是每隔一个预定的时间周期来获取该音频信号,并且针对每次获取的该音频信号采用该压缩方法进行即时的处理。
在步骤S11中,将音频信号转换为数字信号模式。
在步骤S12中,对音频信号进行加重处理。本申请的发明人在实际的对音频信号的分析中发现,生猪的音频信号中的高频信号部分包括较多的信息量,并且该高频信号部分的衰减也比较大。因此在该实施方式中,可以对该音频信号进行加重处理。具体地,可以是对该音频信号中的高频信号部分进行加重处理,从而消除该音频信号中的低频信号部分的噪声干扰,同时还能够增强该音频信号中的频谱成分。更具体地,该加重处理的传递函数可以为公式(1),
H(z)=1-αz-1, (1)
其中,H(z)为高通滤波器的传递函数,z为对音频信号进行处理过程中的变化z域,α为预加重系数。对于该预加重系数α的取值范围,可以是本领域人员所知的多个数值。在本发明的一个示例中,该预加重系数α的取值范围可以是0.9至1.0。优选地,考虑到加重处理的处理效果,该预加重系数α可以为0.98。相应地,该加重处理的具体操作则可以包括根据公式(2)执行该加重处理,
s(n)=x(n)-αx(n-1), (2)
其中,s(n)为加重处理后的音频信号,x(n)为音频信号的n时刻的语音采样值,x(n-1)为音频信号的n-1时刻的语音采样值。在该实施方式中,该高通滤波器的幅频特性可以是如图2所示,相频特性可以是如图3所示。该音频信号经过高通滤波器处理前后的时域波形如图4所示,经过高通滤波器处理前后的信号频谱变化如图5所示。
在步骤S13中,对加重处理后的音频信号执行归一化操作。
在步骤S14中,对归一化操作后的音频信号进行加窗分帧处理。在该实施方式中,考虑到经过归一化操作后的音频信号是一种短时平稳信号,在10-30ms的时间段内该语音信号是近似不变的。那么,可以采用加窗分帧处理将该语音信号分成一帧一帧的状态来处理。在该加窗分帧处理的过程中,帧移和帧长的比值的范围可以设置为0至0.5。具体地,该加窗分帧处理可以是例如根据公式(3)和公式(4)处理该音频信号,
q=s(n)*w(n), (3)
Figure BDA0002277719180000081
其中,q为加窗分帧处理后的音频信号,s(n)为加窗分帧处理前的音频信号,w(n)为汉明窗函数,N为汉明窗函数的窗长。其中,对于该窗长的确定,考虑到窗长的宽度过窄会导致该加窗分帧处理出现截断效应,而窗长的宽度过长则会导致该加窗分帧处理的信号过渡过于平滑。因此,在本发明的一个优选示例中,该窗长可以优选为60。其汉明窗函数时域波形图以及汉明窗函数幅度特性图可以是如图6所示。
在步骤S15中,对加窗分帧处理后的音频信号进行端点检测以确定音频信号的有效信号部分。在该实施方式中,考虑到该音频信号是通过音频采集设备直接从现场采集的,那么该音频信号中势必包括较多的噪声以及无用信号部分。在压缩以及后续的过程中,这些噪声及无用信号部分不仅会增加系统的运算量和处理时间,同时也会降低系统的识别率。因此,在该实施方式中可以对加窗分帧处理后的音频信号进行端点检测以确定该音频信号中的有效信号部分。从而降低系统的运算量,同时提高系统的识别率。具体地,该步骤S15可以包括根据公式(5)至公式(6)确定该音频信号的有效信号部分,
Figure BDA0002277719180000091
其中,En为音频信号的短时能量,M为音频信号的帧数,qn为音频信号的第n帧。其中,短时能量是表示截取的采样值的平方和。短时能量越大表示截取的采样值(音频信号)的浊音越多,而相对地短时能量越小则表示截取的采样值的清音越多。因此,可以根据该短时能量的变化来确定该该音频信号的清浊音的过度时间,从而衡量音频信号的有效信号部分和无效信号部分的界限。具体地,在有效信号部分产生时,该短时能量会快速增加,此时可以确认该点为无效信号部分和有效信号部分的一个界限。进一步地,也可以采用该短时能量的变化来确定无效信号部分的噪声,例如在该短时能量突然增大并且又立即变小时,该部分的音频信号即可以确认为噪声。另外,考虑到计算机位数的限制,在计算短时能量的过程中容易产生溢出的问题,因此在和本发明的一个优选示例中可以采用短时平均幅度来替代该短时能量的计算,并且两者的变化特征一致。具体地,该短时平均幅度可以采用公式(5-1)来计算,
Figure BDA0002277719180000092
其中,M(n)为该短时平均幅度,M为音频信号的帧数,qn为该音频信号的第n帧。
Figure BDA0002277719180000101
其中,Zn为音频信号的平均过零率,qn为音频信号的第n帧,M为音频信号的帧数。在该实施方式中,由于该音频信号是通过采样的方式来获取的,那么相邻的离散语音信号的值相反时,其中间必然存在一个零点,该音频信号经过零点的过程可以称为“过零”现象。相应地,该音频信号在单位时间内经过零点的次数则可以称为过零率。该平均过零率即为该音频信号的多个单位时间内的过零率的平均值。对于采用平均过零率判断该音频信号的有效信号部分和无效信号部分的具体过程,则可以为平均过零率比较高的区间为清音,平均过零率比较低的区间为浊音。此外,还可以根据平均过零率来确定该有效信号部分和无效信号部分的界限。如图7所示是根据本发明的一个示例的短时能量平均过零率的对照波形图。
具体地,同时结合短时能量和平均过零率确定该音频信号中的有效信号部分的过程可以是例如:首先基于短时能量和平均过零率中的一个设置低门限,并基于其中的另一个设置高门限。在音频信号超过低门限时,该段音频信号则可以为起始点,即有效信号部分的起始点。在音频信号超过高门限时,该段音频信号则可以为语音部分,即实际的有效信号部分。
通过上述方式则可以将该音频信号分成四段,即无声段、过渡段、语音段和结束段。在无声段,无论是短时能量还是平均过零率均会小于低门限;在过渡段,短时能量和平均过零率均小于低门限;在语音段,短时能量和/或平均过零率会超过高门限;在结束段,短时能量和平均过零率均小于低门限。最终,可以将该语音段作为该有效信号部分。
在步骤S16中,提取有效信号部分以作为预处理后的音频信号。
在步骤S17中,采用谱减法压缩预处理后的音频信号。具体地,该谱减法可以包括如图8所示出的步骤。在该图8中,该谱减法可以包括:
在步骤S20中,采用公式(7)至公式(13)对音频信号进行稀疏化操作,
y(n)=q(n)+d(n), (7)
其中,y(n)为带有噪音的音频信号Y(n)的第n帧,q(n)为音频信号中的纯净部分,d(n)为音频信号中的噪音部分D(n)的第n帧;
Figure BDA0002277719180000111
其中,Y(ω)为带有噪音的音频信号Y(n)的极坐标形式,|Y(ω)|为对应的幅度谱,
Figure BDA0002277719180000112
为带有噪音的音频信号Y(n)的相位谱,
Figure BDA0002277719180000113
为音频信号Y(n)的相位,
Figure BDA0002277719180000114
其中,D(ω)为音频信号中的噪音部分D(n)极坐标形式,|D(ω)|为对应的幅度谱,
Figure BDA0002277719180000115
为噪音部分D(n)的相位谱,为噪音部分D(n)的相位,
其中,f(ω)为音频信号的极坐标形式,Y(ω)为带有噪音的音频信号Y(n)的极坐标形式,
Figure BDA0002277719180000118
为D(ω)的估计值,
Figure BDA0002277719180000119
为带有噪音的音频信号Y(n)的相位谱,
Figure BDA00022777191800001110
为音频信号Y(n)的相位,
Figure BDA00022777191800001111
其中,F(k)为音频信号f的DCT变换,f(i)为音频信号f的第i帧,n为音频信号f的帧数,
F=α·f, (13)
其中,F为稀疏化处理后的音频信号,α为标准正交基,f为稀疏化处理前的音频信号;
在步骤S21中,根据公式(14)至公式(16)构建音频信号的观测矩阵以得到压缩后的音频信号,
M≥cKlog(N/K)<<N, (15)
Figure BDA0002277719180000122
其中,ε∈(0,1),θ为M×N的预设的测量矩阵,F为稀疏化处理后的音频信号,K为稀疏度的值,α为标准正交基,f为稀疏化处理前的音频信号,A为观测矩阵,为传感矩阵。
另一方面,本发明还提供一种用于音频信号的压缩系统,该压缩系统可以包括处理器,该处理器可以用于执行如上述任一所述的压缩方法。
另一方面,本发明还提供一种用于生猪的音频信号的传输方法,该传输方法可以包括:
采用如上述任一所述的压缩方法压缩音频信号;
接收端接收音频信号,并采用公式(17)至公式(21)对音频信号进行重构以得到解码后的音频信号,
A=argmin||θ·F||0s.t.A=θ·F, (17)
其中,s.t.为表示受限于,A为观测矩阵,θ为测量矩阵,F为稀疏化处理后的音频信号,
Figure BDA0002277719180000124
Figure BDA0002277719180000125
Figure BDA0002277719180000127
其中,λt为第t次迭代找到的索引,N为测量矩阵θ的元素的个数,rt-1为t=t-1时的残差,
Figure BDA0002277719180000128
为传感矩阵φ(与传感矩阵相同)的第j列,∧t为t次迭代的索引的集合,∧t-1为t-1次迭代的索引的集合,φt为第t次迭代的传感矩阵φ的重建原子集合,φt-1为第t-1次迭代的传感矩阵φ的重建原子集合,
Figure BDA0002277719180000131
为传感矩阵的第λt列,
Figure BDA0002277719180000132
为音频信号F的稀疏逼近值,
Figure BDA0002277719180000133
为第t次迭代的音频信号值,rt为解码后的残差更新的值。
在本发明的一个实施方式中,该传输方法可以包括预设音频采集系统以获取音频信号。其中,该音频采集系统包括音频采集节点01、第一处理器02、通信装置03和终端04。
音频采集节点01可以设置于现场,用于采集音频信号。第一处理器02可以用于执行如上述任一所述的压缩方法,从而压缩该音频信号。通信装置03可以用于传输压缩后的音频信号。终端04则可以用于接收音频信号并采用公式(17)至公式(21)解码音频信号,从而完成对该音频信号的传输。
再一方面,本发明还提供一种用于生猪的音频信号的传输系统,该传输系统可以包括处理器,该处理器可以用于执行如上述所述的传输方法。
再一方面,本发明还提供一种存储介质,该存储介质可以存储有指令,该指令可以用于被机器读取以使得机器执行如上述任一所述的方法。
通过上述技术方案,本发明提供的用于生猪的音频信号的压缩方法及系统通过对音频信号依次进行转换、加重、归一化操作、加窗分帧处理以得到音频信号中的有效信号部分,再采用谱减法对该有效部分进行压缩,解决了现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题。本发明提供的用于生猪的音频信号的传输方法及系统通过采用上述压缩方法及系统克服了现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题,提高了音频信号的传输效率和准确度。
以上结合附图详细描述了本发明例的可选实施方式,但是,本发明实施方式并不限于上述实施方式中的具体细节,在本发明实施方式的技术构思范围内,可以对本发明实施方式的技术方案进行多种简单变型,这些简单变型均属于本发明实施方式的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施方式对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施方式的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施方式的思想,其同样应当视为本发明实施方式所公开的内容。

Claims (10)

1.一种用于生猪的音频信号的压缩方法,其特征在于,所述压缩方法包括:
获取所述音频信号;
将所述音频信号转换为数字信号模式;
对所述音频信号进行加重处理;
对加重处理后的所述音频信号执行归一化操作;
对归一化操作后的所述音频信号进行加窗分帧处理;
对加窗分帧处理后的所述音频信号进行端点检测以确定所述音频信号的有效信号部分;
提取所述有效信号部分以作为预处理后的所述音频信号;
采用谱减法压缩预处理后的所述音频信号。
2.根据权利要求1所述的压缩方法,其特征在于,所述加重处理的传递函数为公式(1),
H(z)=1-αz-1, (1)
其中,H(z)为高通滤波器的所述传递函数,z为对所述音频信号进行处理过程中的变化z域,α为预加重系数;
所述加重处理包括:
根据公式(2)执行所述加重处理,
s(n)=x(n)-αx(n-1), (2)
其中,s(n)为加重处理后的音频信号,x(n)为所述音频信号的n时刻的语音采样值,x(n-1)为所述音频信号的n-1时刻的语音采样值。
3.根据权利要求1所述的压缩方法,其特征在于,所述加窗分帧处理包括:
根据公式(3)和公式(4)处理所述音频信号,
q=s(n)*w(n), (3)
Figure FDA0002277719170000021
其中,q为加窗分帧处理后的所述音频信号,s(n)为加窗分帧处理前的所述音频信号,w(n)为汉明窗函数,N为所述汉明窗函数的窗长。
4.根据权利要求1所述的压缩方法,其特征在于,所述端点检测包括:
根据公式(5)至公式(6)确定所述音频信号的有效信号部分,
Figure FDA0002277719170000022
其中,En为所述音频信号的短时能量,M为所述音频信号的帧数,qn为所述音频信号的第n帧;
其中,Zn为所述音频信号的平均过零率,qn为所述音频信号的第n帧,M为所述音频信号的帧数。
5.根据权利要求1所述的压缩方法,其特征在于,所述谱减法包括:
采用公式(7)至公式(13)对所述音频信号进行稀疏化操作,
y(n)=q(n)+d(n), (7)
其中,y(n)为带有噪音的音频信号Y(n)的第n帧,q(n)为所述音频信号中的纯净部分,d(n)为所述音频信号中的噪音部分D(n)的第n帧;
Figure FDA0002277719170000024
其中,Y(ω)为带有噪音的音频信号Y(n)的极坐标形式,|Y(ω)|为对应的幅度谱,
Figure FDA0002277719170000025
为带有噪音的音频信号Y(n)的相位谱,为音频信号Y(n)的相位,
其中,D(ω)为所述音频信号中的噪音部分D(n)极坐标形式,|D(ω)|为对应的幅度谱,
Figure FDA0002277719170000032
为噪音部分D(n)的相位谱,
Figure FDA0002277719170000033
为噪音部分D(n)的相位,
Figure FDA0002277719170000034
其中,f(ω)为所述音频信号的极坐标形式,Y(ω)为带有噪音的音频信号Y(n)的极坐标形式,为D(ω)的估计值,
Figure FDA0002277719170000036
为带有噪音的音频信号Y(n)的相位谱,
Figure FDA0002277719170000037
为音频信号Y(n)的相位,
Figure FDA0002277719170000038
其中,F(k)为所述音频信号f的DCT变换,f(i)为所述音频信号f的第i帧,n为所述音频信号f的帧数,
F=α·f, (13)
其中,F为稀疏化处理后的所述音频信号,α为标准正交基,f为稀疏化处理前的所述音频信号;
根据公式(14)至公式(16)构建所述音频信号的观测矩阵以得到压缩后的所述音频信号,
Figure FDA00022777191700000310
M≥cKlog(N/K)<<N, (15)
Figure FDA00022777191700000311
其中,ε∈(0,1),θ为M×N的预设的测量矩阵,F为稀疏化处理后的所述音频信号,K为稀疏度的值,α为标准正交基,f为稀疏化处理前的所述音频信号,A为所述观测矩阵,
Figure FDA00022777191700000312
为传感矩阵。
6.一种用于音频信号的压缩系统,其特征在于,所述压缩系统包括处理器,所述处理器用于执行如权利要求1至5任一所述的压缩方法。
7.一种用于生猪的音频信号的传输方法,其特征在于,所述传输方法包括:
采用如权利要求1至5任一所述的压缩方法压缩所述音频信号;
接收端接收所述音频信号,并采用公式(17)至公式(21)对所述音频信号进行重构以得到解码后的所述音频信号,
A=argmin||θ·F||0s.t.A=θ·F, (17)
其中,s.t.为表示受限于,A为所述观测矩阵,θ为测量矩阵,F为稀疏化处理后的所述音频信号,
Figure FDA0002277719170000043
Figure FDA0002277719170000044
其中,λt为第t次迭代找到的索引,N为测量矩阵θ的元素的个数,rt-1为t=t-1时的残差,
Figure FDA0002277719170000045
为传感矩阵φ的第j列,∧t为t次迭代的索引的集合,∧t-1为t-1次迭代的索引的集合,φt为第t次迭代的传感矩阵φ的重建原子集合,φt-1为第t-1次迭代的传感矩阵φ的重建原子集合,
Figure FDA0002277719170000046
为传感矩阵的第λt列,
Figure FDA0002277719170000047
为音频信号F的稀疏逼近值,
Figure FDA0002277719170000048
为第t次迭代的音频信号值,rt为解码后的残差更新的值。
8.根据权利要求7所述的传输方法,其特征在于,所述传输方法包括预设音频采集系统以获取所述音频信号,其中,所述音频采集系统包括:
音频采集节点,设置于现场,用于采集所述音频信号;
第一处理器,用于执行如权利要求1至5任一所述的压缩方法;
通信装置,用于传输压缩后的所述音频信号;
终端,用于接收所述音频信号并采用公式(17)至公式(21)解码所述音频信号。
9.一种用于生猪的音频信号的传输系统,其特征在于,所述传输系统包括处理器,所述处理器用于执行如权利要求7或8所述的传输方法。
10.一种存储介质,其特征在于,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如权利要求1至5、7、8任一所述的方法。
CN201911128880.XA 2019-11-18 2019-11-18 用于生猪的音频信号的压缩方法及系统 Pending CN110689898A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911128880.XA CN110689898A (zh) 2019-11-18 2019-11-18 用于生猪的音频信号的压缩方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911128880.XA CN110689898A (zh) 2019-11-18 2019-11-18 用于生猪的音频信号的压缩方法及系统

Publications (1)

Publication Number Publication Date
CN110689898A true CN110689898A (zh) 2020-01-14

Family

ID=69116994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911128880.XA Pending CN110689898A (zh) 2019-11-18 2019-11-18 用于生猪的音频信号的压缩方法及系统

Country Status (1)

Country Link
CN (1) CN110689898A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160853A (zh) * 2021-03-31 2021-07-23 深圳鱼亮科技有限公司 一种基于实时人脸辅助的语音端点检测方法
CN113488071A (zh) * 2021-07-16 2021-10-08 河南牧原智能科技有限公司 一种猪只咳嗽识别方法、装置、设备及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE29724362U1 (de) * 1997-07-11 2001-02-22 Terbrack, Leo, Dipl.-Ing., 48683 Ahaus Fütterungsanlage mit Eingabe per Mikrophon
CN102436809A (zh) * 2011-10-21 2012-05-02 东南大学 英语口语机考系统中网络语音识别方法
CN106847262A (zh) * 2016-12-28 2017-06-13 华中农业大学 一种猪呼吸道疾病自动识别报警方法
CN107450883A (zh) * 2017-07-19 2017-12-08 维沃移动通信有限公司 一种音频数据处理方法、装置及移动终端
CN108490494A (zh) * 2018-03-12 2018-09-04 中国科学院电子学研究所 基于谱减法及小波分析的海洋磁测噪声抑制方法
CN109258509A (zh) * 2018-11-16 2019-01-25 太原理工大学 一种生猪异常声音智能监测系统与方法
CN110265041A (zh) * 2019-07-01 2019-09-20 河南牧业经济学院 一种收集、分析猪的发声行为的方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE29724362U1 (de) * 1997-07-11 2001-02-22 Terbrack, Leo, Dipl.-Ing., 48683 Ahaus Fütterungsanlage mit Eingabe per Mikrophon
CN102436809A (zh) * 2011-10-21 2012-05-02 东南大学 英语口语机考系统中网络语音识别方法
CN106847262A (zh) * 2016-12-28 2017-06-13 华中农业大学 一种猪呼吸道疾病自动识别报警方法
CN107450883A (zh) * 2017-07-19 2017-12-08 维沃移动通信有限公司 一种音频数据处理方法、装置及移动终端
CN108490494A (zh) * 2018-03-12 2018-09-04 中国科学院电子学研究所 基于谱减法及小波分析的海洋磁测噪声抑制方法
CN109258509A (zh) * 2018-11-16 2019-01-25 太原理工大学 一种生猪异常声音智能监测系统与方法
CN110265041A (zh) * 2019-07-01 2019-09-20 河南牧业经济学院 一种收集、分析猪的发声行为的方法和系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
周小星: "基于CS的语音增强新算法研究及语音处理仿真平台开发", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *
宋知用主编: "《MATLAB语音信号分析与合成 第2版》", 31 January 2018, 北京航空航天大学出版社 *
畅江等: "帧间自适应的压缩感知谱减去噪方法", 《现代电子技术》 *
韩冰主编: "《数字音视频处理》", 30 October 2018, 西安电子科技大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160853A (zh) * 2021-03-31 2021-07-23 深圳鱼亮科技有限公司 一种基于实时人脸辅助的语音端点检测方法
CN113488071A (zh) * 2021-07-16 2021-10-08 河南牧原智能科技有限公司 一种猪只咳嗽识别方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
KR100770839B1 (ko) 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
JP5826291B2 (ja) 音声信号からの特徴フィンガープリントの抽出及びマッチング方法
JP2884163B2 (ja) 符号化伝送装置
KR100930060B1 (ko) 신호 검출 방법, 장치 및 그 방법을 실행하는 프로그램이기록된 기록매체
Kesarkar et al. Feature extraction for speech recognition
CN113192536B (zh) 语音质量检测模型的训练方法、语音质量检测方法及装置
CN110689898A (zh) 用于生猪的音频信号的压缩方法及系统
CN112967735B (zh) 语音质量检测模型的训练方法及语音质量的检测方法
KR20190052122A (ko) 다중 채널 오디오 신호 처리 방법, 장치 및 시스템
JP5764488B2 (ja) 復号装置及び復号方法
JP6487569B2 (ja) チャネル間時間差パラメータを決定するための方法および装置
TWI590237B (zh) 用以估計音訊信號中雜訊之方法、雜訊估計器、音訊編碼器、音訊解碼器、及用以傳送音訊信號之系統
CN114627899A (zh) 声音信号检测方法及装置、计算机可读存储介质、终端
KR100930061B1 (ko) 신호 검출 방법 및 장치
US20070011001A1 (en) Apparatus for predicting the spectral information of voice signals and a method therefor
JP6728142B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
KR20170088165A (ko) 심층 신경망 기반 음성인식 방법 및 그 장치
RU2317595C1 (ru) Способ обнаружения пауз в речевых сигналах и устройство его реализующее
JP3418005B2 (ja) 音声ピッチ検出装置
CN115881142A (zh) 一种骨导语音编码模型的训练方法、装置及存储介质
CN112767953B (zh) 语音编码方法、装置、计算机设备和存储介质
JP2002049397A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
CN113327633A (zh) 基于深度神经网络模型的带噪语音端点检测方法及装置
CN115620740A (zh) 对回声路径的语音延时估计方法、装置和存储介质
CN112927700A (zh) 一种盲音频水印嵌入和提取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200114