CN110689898A

CN110689898A - 用于生猪的音频信号的压缩方法及系统

Info

Publication number: CN110689898A
Application number: CN201911128880.XA
Authority: CN
Inventors: 吴亚文; 何屿彤; 焦俊; 张双龙; 孙裴; 辜丽川; 张锋; 邵睿; 李斌
Original assignee: Anhui Acquisitive Internet Of Things Co Ltd; Anhui Agricultural University AHAU
Current assignee: Anhui Acquisitive Internet Of Things Co Ltd; Anhui Agricultural University AHAU
Priority date: 2019-11-18
Filing date: 2019-11-18
Publication date: 2020-01-14

Abstract

本发明实施方式提供一种用于生猪的音频信号的压缩方法及系统，属于音频信号的压缩传输技术领域。所述压缩方法包括：获取所述音频信号；将所述音频信号转换为数字信号模式；对所述音频信号进行加重处理；对加重处理后的所述音频信号执行归一化操作；对归一化操作后的所述音频信号进行加窗分帧处理；对加窗分帧处理后的所述音频信号进行端点检测以确定所述音频信号的有效信号部分；提取所述有效信号部分以作为预处理后的所述音频信号；采用谱减法压缩预处理后的所述音频信号。该压缩传输方法及系统能够解决现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题。

Description

用于生猪的音频信号的压缩方法及系统

技术领域

本发明涉及音频信号的压缩传输技术领域，具体地涉及一种用于生猪的音频信号的压缩方法及系统。

背景技术

生猪声音信息可以作为识别健康与否的依据，因此基于多媒体传感网的生猪音频信息采集和传输是需要解决的主要问题，同时音频信息也反映生猪健康状况，交流和表达情感的重要途径。但是在多媒体WSN中，声音传输时会出现的信息碰撞和拥塞问题，因此需要通过压缩感知技术对生猪音频信号进行处理。

发明内容

本发明实施方式的目的是提供一种用于生猪的音频信号的压缩方法及系统，该压缩传输方法及系统能够解决现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题。

为了实现上述目的，本发明实施方式提供一种用于生猪的音频信号的压缩方法，所述压缩方法可以包括：

获取所述音频信号；

将所述音频信号转换为数字信号模式；

对所述音频信号进行加重处理；

对加重处理后的所述音频信号执行归一化操作；

对归一化操作后的所述音频信号进行加窗分帧处理；

对加窗分帧处理后的所述音频信号进行端点检测以确定所述音频信号的有效信号部分；

提取所述有效信号部分以作为预处理后的所述音频信号；

采用谱减法压缩预处理后的所述音频信号。

可选地，所述加重处理的传递函数为公式(1)，

H(z)＝1-αz^-1， (1)

其中，H(z)为高通滤波器的所述传递函数，z为对所述音频信号进行处理过程中的变化z域，α为预加重系数；

所述加重处理包括：

根据公式(2)执行所述加重处理，

s(n)＝x(n)-αx(n-1)， (2)

其中，s(n)为加重处理后的音频信号，x(n)为所述音频信号的n时刻的语音采样值，x(n-1)为所述音频信号的n-1时刻的语音采样值。

可选地，所述加窗分帧处理包括：

根据公式(3)和公式(4)处理所述音频信号，

q＝s(n)*w(n)， (3)

其中，q为加窗分帧处理后的所述音频信号，s(n)为加窗分帧处理前的所述音频信号，w(n)为汉明窗函数，N为所述汉明窗函数的窗长。

可选地，所述端点检测包括：

根据公式(5)至公式(6)确定所述音频信号的有效信号部分，

其中，E_n为所述音频信号的短时能量，M为所述音频信号的帧数，q_n为所述音频信号的第n帧；

其中，Z_n为所述音频信号的平均过零率，q_n为所述音频信号的第n帧，M为所述音频信号的帧数。

可选地，所述谱减法包括：

采用公式(7)至公式(13)对所述音频信号进行稀疏化操作，

y(n)＝q(n)+d(n)， (7)

其中，y(n)为带有噪音的音频信号Y(n)的第n帧，q(n)为所述音频信号中的纯净部分，d(n)为所述音频信号中的噪音部分D(n)的第n帧；

其中，Y(ω)为带有噪音的音频信号Y(n)的极坐标形式，|Y(ω)|为对应的幅度谱，

为带有噪音的音频信号Y(n)的相位谱，

为音频信号Y(n)的相位，

其中，D(ω)为所述音频信号中的噪音部分D(n)极坐标形式，|D(ω)|为对应的幅度谱，

为噪音部分D(n)的相位谱，

为噪音部分D(n)的相位，

其中，f(ω)为所述音频信号的极坐标形式，Y(ω)为带有噪音的音频信号Y(n)的极坐标形式，

为D(ω)的估计值，

为带有噪音的音频信号Y(n)的相位谱，

为音频信号Y(n)的相位，

其中，F(k)为所述音频信号f的DCT变换，f(i)为所述音频信号f的第i帧，n为所述音频信号f的帧数，

F＝α·f， (13)

其中，F为稀疏化处理后的所述音频信号，α为标准正交基，f为稀疏化处理前的所述音频信号；

根据公式(14)至公式(16)构建所述音频信号的观测矩阵以得到压缩后的所述音频信号，

M≥cKlog(N/K)＜＜N， (15)

其中，ε∈(0，1)，θ为M×N的预设的测量矩阵，F为稀疏化处理后的所述音频信号，K为稀疏度的值，α为标准正交基，f为稀疏化处理前的所述音频信号，A为所述观测矩阵，

为传感矩阵。

另一方面，本发明还提供一种用于音频信号的压缩系统，所述压缩系统包括处理器，所述处理器用于执行如上述任一所述的压缩方法。

另一方面，本发明还提供一种用于生猪的音频信号的传输方法，所述传输方法包括：

采用如上述任一所述的压缩方法压缩所述音频信号；

接收端接收所述音频信号，并采用公式(17)至公式(21)对所述音频信号进行重构以得到解码后的所述音频信号，

A＝argmin||θ·F||₀s.t.A＝θ·F， (17)

其中，s.t.为表示受限于，A为所述观测矩阵，θ为测量矩阵，F为稀疏化处理后的所述音频信号，

其中，λ_t为第t次迭代找到的索引，N为测量矩阵θ的元素的个数，r_t-1为t＝t-1时的残差，为传感矩阵φ的第j列，∧_t为t次迭代的索引的集合，∧_t-1为t-1次迭代的索引的集合，φ_t为第t次迭代的传感矩阵φ的重建原子集合，φ_t-1为第t-1次迭代的传感矩阵φ的重建原子集合，

为传感矩阵的第λ_t列，

为音频信号F的稀疏逼近值，为第t次迭代的音频信号值，r_t为解码后的残差更新的值。

可选地，所述传输方法包括预设音频采集系统以获取所述音频信号，其中，所述音频采集系统包括：

音频采集节点，设置于现场，用于采集所述音频信号；

第一处理器，用于执行如权利要求1至5任一所述的压缩方法；

通信装置，用于传输压缩后的所述音频信号；

终端，用于接收所述音频信号并采用公式(17)至公式(21)解码所述音频信号。

再一方面，本发明还提供一种用于生猪的音频信号的传输系统，所述传输系统包括处理器，所述处理器用于执行如上述所述的传输方法。

再一方面，本发明还提供一种存储介质，所述存储介质存储有指令，所述指令用于被机器读取以使得所述机器执行如上述任一所述的方法。

通过上述技术方案，本发明提供的用于生猪的音频信号的压缩方法及系统通过对音频信号依次进行转换、加重、归一化操作、加窗分帧处理以得到音频信号中的有效信号部分，再采用谱减法对该有效部分进行压缩，解决了现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题。本发明提供的用于生猪的音频信号的传输方法及系统通过采用上述压缩方法及系统克服了现有技术中存在的生猪的音频信号在传输时出现的信息碰撞和拥塞的技术问题，提高了音频信号的传输效率和准确度。

本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施方式的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明实施方式，但并不构成对本发明实施方式的限制。在附图中：

图1是根据本发明的一个实施方式的用于生猪的音频信号的传输方法的流程图；

图2是根据本发明的一个实施方式的高通滤波器的幅频特性图；

图3是根据本发明的一个实施方式的高通滤波器的相频特性图；

图4是根据本发明的一个实施方式的音频信号经过高通滤波器处理前后的时域波形图；

图5是根据本发明的一个实施方式的音频信号经过高通滤波器处理前后的频谱变化图；

图6是根据本发明的一个实施方式的汉明窗函数时域波形图以及汉明窗函数幅度特性图；

图7是根据本发明的一个示例的短时能量平均过零率的对照波形图；以及

图8是根据本发明的一个实施方式的谱减法的流程图。

具体实施方式

以下结合附图对本发明实施方式的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明实施方式，并不用于限制本发明实施方式。

在本发明实施方式中，在未作相反说明的情况下，使用的方位词如“上、下、顶、底”通常是针对附图所示的方向而言的或者是针对竖直、垂直或重力方向上而言的各部件相互位置关系描述用词。

另外，若本发明实施方式中有涉及“第一”、“第二”等的描述，则该“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施方式之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

如图1所示是根据本发明的一个实施方式的用于生猪的音频信号的压缩方法的流程图。在图1中，该压缩方法可以包括：

在步骤S10中，获取音频信号。在该实施方式中，获取该音频信号的频率可以是每隔一个预定的时间周期来获取该音频信号，并且针对每次获取的该音频信号采用该压缩方法进行即时的处理。

在步骤S11中，将音频信号转换为数字信号模式。

在步骤S12中，对音频信号进行加重处理。本申请的发明人在实际的对音频信号的分析中发现，生猪的音频信号中的高频信号部分包括较多的信息量，并且该高频信号部分的衰减也比较大。因此在该实施方式中，可以对该音频信号进行加重处理。具体地，可以是对该音频信号中的高频信号部分进行加重处理，从而消除该音频信号中的低频信号部分的噪声干扰，同时还能够增强该音频信号中的频谱成分。更具体地，该加重处理的传递函数可以为公式(1)，

H(z)＝1-αz^-1， (1)

其中，H(z)为高通滤波器的传递函数，z为对音频信号进行处理过程中的变化z域，α为预加重系数。对于该预加重系数α的取值范围，可以是本领域人员所知的多个数值。在本发明的一个示例中，该预加重系数α的取值范围可以是0.9至1.0。优选地，考虑到加重处理的处理效果，该预加重系数α可以为0.98。相应地，该加重处理的具体操作则可以包括根据公式(2)执行该加重处理，

s(n)＝x(n)-αx(n-1)， (2)

其中，s(n)为加重处理后的音频信号，x(n)为音频信号的n时刻的语音采样值，x(n-1)为音频信号的n-1时刻的语音采样值。在该实施方式中，该高通滤波器的幅频特性可以是如图2所示，相频特性可以是如图3所示。该音频信号经过高通滤波器处理前后的时域波形如图4所示，经过高通滤波器处理前后的信号频谱变化如图5所示。

在步骤S13中，对加重处理后的音频信号执行归一化操作。

在步骤S14中，对归一化操作后的音频信号进行加窗分帧处理。在该实施方式中，考虑到经过归一化操作后的音频信号是一种短时平稳信号，在10-30ms的时间段内该语音信号是近似不变的。那么，可以采用加窗分帧处理将该语音信号分成一帧一帧的状态来处理。在该加窗分帧处理的过程中，帧移和帧长的比值的范围可以设置为0至0.5。具体地，该加窗分帧处理可以是例如根据公式(3)和公式(4)处理该音频信号，

q＝s(n)*w(n)， (3)

其中，q为加窗分帧处理后的音频信号，s(n)为加窗分帧处理前的音频信号，w(n)为汉明窗函数，N为汉明窗函数的窗长。其中，对于该窗长的确定，考虑到窗长的宽度过窄会导致该加窗分帧处理出现截断效应，而窗长的宽度过长则会导致该加窗分帧处理的信号过渡过于平滑。因此，在本发明的一个优选示例中，该窗长可以优选为60。其汉明窗函数时域波形图以及汉明窗函数幅度特性图可以是如图6所示。

在步骤S15中，对加窗分帧处理后的音频信号进行端点检测以确定音频信号的有效信号部分。在该实施方式中，考虑到该音频信号是通过音频采集设备直接从现场采集的，那么该音频信号中势必包括较多的噪声以及无用信号部分。在压缩以及后续的过程中，这些噪声及无用信号部分不仅会增加系统的运算量和处理时间，同时也会降低系统的识别率。因此，在该实施方式中可以对加窗分帧处理后的音频信号进行端点检测以确定该音频信号中的有效信号部分。从而降低系统的运算量，同时提高系统的识别率。具体地，该步骤S15可以包括根据公式(5)至公式(6)确定该音频信号的有效信号部分，

其中，E_n为音频信号的短时能量，M为音频信号的帧数，q_n为音频信号的第n帧。其中，短时能量是表示截取的采样值的平方和。短时能量越大表示截取的采样值(音频信号)的浊音越多，而相对地短时能量越小则表示截取的采样值的清音越多。因此，可以根据该短时能量的变化来确定该该音频信号的清浊音的过度时间，从而衡量音频信号的有效信号部分和无效信号部分的界限。具体地，在有效信号部分产生时，该短时能量会快速增加，此时可以确认该点为无效信号部分和有效信号部分的一个界限。进一步地，也可以采用该短时能量的变化来确定无效信号部分的噪声，例如在该短时能量突然增大并且又立即变小时，该部分的音频信号即可以确认为噪声。另外，考虑到计算机位数的限制，在计算短时能量的过程中容易产生溢出的问题，因此在和本发明的一个优选示例中可以采用短时平均幅度来替代该短时能量的计算，并且两者的变化特征一致。具体地，该短时平均幅度可以采用公式(5-1)来计算，

其中，M(n)为该短时平均幅度，M为音频信号的帧数，q_n为该音频信号的第n帧。

其中，Z_n为音频信号的平均过零率，q_n为音频信号的第n帧，M为音频信号的帧数。在该实施方式中，由于该音频信号是通过采样的方式来获取的，那么相邻的离散语音信号的值相反时，其中间必然存在一个零点，该音频信号经过零点的过程可以称为“过零”现象。相应地，该音频信号在单位时间内经过零点的次数则可以称为过零率。该平均过零率即为该音频信号的多个单位时间内的过零率的平均值。对于采用平均过零率判断该音频信号的有效信号部分和无效信号部分的具体过程，则可以为平均过零率比较高的区间为清音，平均过零率比较低的区间为浊音。此外，还可以根据平均过零率来确定该有效信号部分和无效信号部分的界限。如图7所示是根据本发明的一个示例的短时能量平均过零率的对照波形图。

具体地，同时结合短时能量和平均过零率确定该音频信号中的有效信号部分的过程可以是例如：首先基于短时能量和平均过零率中的一个设置低门限，并基于其中的另一个设置高门限。在音频信号超过低门限时，该段音频信号则可以为起始点，即有效信号部分的起始点。在音频信号超过高门限时，该段音频信号则可以为语音部分，即实际的有效信号部分。

通过上述方式则可以将该音频信号分成四段，即无声段、过渡段、语音段和结束段。在无声段，无论是短时能量还是平均过零率均会小于低门限；在过渡段，短时能量和平均过零率均小于低门限；在语音段，短时能量和/或平均过零率会超过高门限；在结束段，短时能量和平均过零率均小于低门限。最终，可以将该语音段作为该有效信号部分。

在步骤S16中，提取有效信号部分以作为预处理后的音频信号。

在步骤S17中，采用谱减法压缩预处理后的音频信号。具体地，该谱减法可以包括如图8所示出的步骤。在该图8中，该谱减法可以包括：

在步骤S20中，采用公式(7)至公式(13)对音频信号进行稀疏化操作，

y(n)＝q(n)+d(n)， (7)

其中，y(n)为带有噪音的音频信号Y(n)的第n帧，q(n)为音频信号中的纯净部分，d(n)为音频信号中的噪音部分D(n)的第n帧；

为带有噪音的音频信号Y(n)的相位谱，

为音频信号Y(n)的相位，

其中，D(ω)为音频信号中的噪音部分D(n)极坐标形式，|D(ω)|为对应的幅度谱，

为噪音部分D(n)的相位谱，为噪音部分D(n)的相位，

其中，f(ω)为音频信号的极坐标形式，Y(ω)为带有噪音的音频信号Y(n)的极坐标形式，

为D(ω)的估计值，

为带有噪音的音频信号Y(n)的相位谱，

为音频信号Y(n)的相位，

其中，F(k)为音频信号f的DCT变换，f(i)为音频信号f的第i帧，n为音频信号f的帧数，

F＝α·f， (13)

其中，F为稀疏化处理后的音频信号，α为标准正交基，f为稀疏化处理前的音频信号；

在步骤S21中，根据公式(14)至公式(16)构建音频信号的观测矩阵以得到压缩后的音频信号，

M≥cKlog(N/K)＜＜N， (15)

其中，ε∈(0，1)，θ为M×N的预设的测量矩阵，F为稀疏化处理后的音频信号，K为稀疏度的值，α为标准正交基，f为稀疏化处理前的音频信号，A为观测矩阵，为传感矩阵。

另一方面，本发明还提供一种用于音频信号的压缩系统，该压缩系统可以包括处理器，该处理器可以用于执行如上述任一所述的压缩方法。

另一方面，本发明还提供一种用于生猪的音频信号的传输方法，该传输方法可以包括：

采用如上述任一所述的压缩方法压缩音频信号；

接收端接收音频信号，并采用公式(17)至公式(21)对音频信号进行重构以得到解码后的音频信号，

A＝argmin||θ·F||₀s.t.A＝θ·F， (17)

其中，s.t.为表示受限于，A为观测矩阵，θ为测量矩阵，F为稀疏化处理后的音频信号，

其中，λ_t为第t次迭代找到的索引，N为测量矩阵θ的元素的个数，r_t-1为t＝t-1时的残差，

为传感矩阵φ(与传感矩阵相同)的第j列，∧_t为t次迭代的索引的集合，∧_t-1为t-1次迭代的索引的集合，φ_t为第t次迭代的传感矩阵φ的重建原子集合，φ_t-1为第t-1次迭代的传感矩阵φ的重建原子集合，

为传感矩阵的第λ_t列，

为音频信号F的稀疏逼近值，

为第t次迭代的音频信号值，r_t为解码后的残差更新的值。

在本发明的一个实施方式中，该传输方法可以包括预设音频采集系统以获取音频信号。其中，该音频采集系统包括音频采集节点01、第一处理器02、通信装置03和终端04。

音频采集节点01可以设置于现场，用于采集音频信号。第一处理器02可以用于执行如上述任一所述的压缩方法，从而压缩该音频信号。通信装置03可以用于传输压缩后的音频信号。终端04则可以用于接收音频信号并采用公式(17)至公式(21)解码音频信号，从而完成对该音频信号的传输。

再一方面，本发明还提供一种用于生猪的音频信号的传输系统，该传输系统可以包括处理器，该处理器可以用于执行如上述所述的传输方法。

再一方面，本发明还提供一种存储介质，该存储介质可以存储有指令，该指令可以用于被机器读取以使得机器执行如上述任一所述的方法。

以上结合附图详细描述了本发明例的可选实施方式，但是，本发明实施方式并不限于上述实施方式中的具体细节，在本发明实施方式的技术构思范围内，可以对本发明实施方式的技术方案进行多种简单变型，这些简单变型均属于本发明实施方式的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本发明实施方式对各种可能的组合方式不再另行说明。

本领域技术人员可以理解实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外，本发明实施方式的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明实施方式的思想，其同样应当视为本发明实施方式所公开的内容。