CN111933181A

CN111933181A - 基于复数阶导数处理的鼾声特征提取、检测方法及其装置

Info

Publication number: CN111933181A
Application number: CN202010663184.5A
Authority: CN
Inventors: 赵江波; 王晓东; 李�杰; 周勇; 钟惠波
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2020-07-10
Filing date: 2020-07-10
Publication date: 2020-11-13
Anticipated expiration: 2040-07-10
Also published as: CN111933181B

Abstract

本发明公开了一种基于复数阶导数处理的鼾声特征提取和检测方法，步骤A、获取待检测音频信号的复数阶导数；步骤B、利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点，从待检测音频信号的复数阶导数中提取鼾声鉴别特征值；步骤C、判断鼾声鉴别特征值是否在所设阈值范围内；如果是，则判定为鼾声，反之则不是鼾声。本发明还提供了一种基于复数阶导数处理的鼾声特征提取和检测装置，以及一种基于复数阶导数处理的鼾声特征提取方法。本发明提取的鼾声特征与其它声音特征有明显区别，提高了鼾声检测的准确度，降低了算法的复杂性。

Description

基于复数阶导数处理的鼾声特征提取、检测方法及其装置

技术领域

本发明涉及信号处理及声音检测领域，尤其涉及一种基于复数阶导数处理的鼾声特征提取方法、检测方法及其装置。

背景技术

在日常生活中，打鼾是一种十分普遍的现象，据有关组织的不完全统计，大约有20％～40％的人群患有打鼾症状。打鼾严重的人会患有阻塞性睡眠呼吸暂停综合征，该病患病率高，严重影响人体健康。为此，研究者们提出了许多止鼾或缓解打鼾的设备，而识别鼾声是各种止鼾或缓解打鼾设备的前提。

现有的鼾声识别方法中，主要可以概括为以下两步。先是对鼾声信号进行处理得到鼾声的特征，然后基于鼾声特征再加以算法实现鼾声识别。例如对音频信号进行处理得到信号的梅尔频率倒谱系数，然后再通过支持向量机来识别是否为鼾声。又如计算音鼾声号的分贝值、周期性等特征，再设置阈值来识别鼾声。可见对鼾声信号进行处理是鼾声识别的关键，现有的鼾声处理方法主要是借鉴语音处理的方法，主要包括时域和频域上的处理，时域上的处理包括提取鼾声的响度、周期性等特征，频域上的处理包括提取基频、熵谱等特征。由于使用现有的鼾声处理方法得到的鼾声特征与其它声音信号区别不明显，使得鼾声识别算法变得复杂且识别率不高、硬件成本增加，不能广泛的应用到民用产品中。

因此，一种能够得到与其它声音特征有明显区别的鼾声处理方法以及设计一种简便、准确率高的鼾声检测方法变得十分重要。

发明内容

有鉴于此，本发明提供了一种基于复数阶导数处理的鼾声特征提取方法、检测方法及其装置，使得提取的鼾声特征与其它声音特征有明显区别，提高了鼾声检测的准确度，降低了算法的复杂性。

为了解决上述技术问题，本发明是这样实现的：

一种基于复数阶导数处理的鼾声特征提取和检测方法，包括：

步骤A、获取待检测音频信号的复数阶导数；复数阶导数实部的选取范围为0<α<3，复数阶导数虚部的选取范围为8<β<11；取值时，α值越大，则β值越小；

步骤B、利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点，从待检测音频信号的复数阶导数中提取鼾声鉴别特征值；

步骤C、判断鼾声鉴别特征值是否在所设阈值范围内；如果是，则判定为鼾声，反之则不是鼾声。

优选地，所述步骤A包括：

a1、将待检测的音频信号x(t)进行快速傅里叶变换，获得x(t)的复数形式并表示为序列：{X_k},k＝0,1,...,(N-1)，k表示序列中的第k个元素，N为序列中元素总数；

a2、获得复数序列{X_k},k＝0,1,...,(N-1)中每个元素的导数X_(α+βi)k：

X_(α+βi)k＝(iω_k)^α+βiX_k；

其中，

ω_k为X_k中提取的角频率；

a3、对序列{X_(α+βi)k},k＝0,1,...,(N-1)做快速傅里叶逆变换，得到音频信号x(t)的复数阶导数。

优选地，所述步骤B利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点，提取鼾声鉴别特征值时：

所述幅值是指音频信号的复数阶导数的实部幅值绝对值；则所述步骤B计算音频信号的复数阶导数的实部幅值绝对值的平均值，作为所述鼾声鉴别特征值。

优选地，所述步骤B利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点，提取鼾声鉴别特征值时：

所述幅值是指音频信号的复数阶导数在复平面中对应的点与原点的距离；则所述步骤B计算在复平面上经复阶导数处理后的音频信号的实部和虚部所组成的点与复平面原点之间距离的平均值，作为所述鼾声鉴别特征值。

优选地，采用8k的采样率采样音频信号，采样精度为16位；并且每5秒进行一次步骤A～C的鼾声检测判断。

优选地，在执行步骤A之前，进一步对采集的音频信号进行降噪与预加重的预处理。

本发明还提供了一种基于复数阶导数处理的鼾声特征提取和检测装置，包括：

复数阶导数获取模块，用于获取待检测音频信号的复数阶导数；复数阶导数求取中，导数阶数的实部选取范围为0<α<3，导数阶数的虚部选取范围为8<β<11；取值时，α值越大，则β值越小；

鼾声鉴别特征值提取模块，用于利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点，从待检测音频信号的复数阶导数中提取鼾声鉴别特征值；

鼾声判断模块，用于判断所述鼾声鉴别特征值是否在所设阈值范围内；如果是，则判定为鼾声，反之则不是鼾声。

优选地，所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点，获取音频信号的复数阶导数的实部幅值绝对值的平均值，作为所述鼾声鉴别特征值。

优选地，所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点，获取音频信号的复数阶导数与复平面原点之间距离的平均值，作为所述鼾声鉴别特征值。

本发明进一步提供了一种基于复数阶导数处理的鼾声特征提取方法，包括：

步骤A、获取音频信号的复数阶导数；该步骤A包括：

a1、将音频信号x(t)进行快速傅里叶变换，获得x(t)的复数形式并表示为序列：{X_k},k＝0,1,...,(N-1)，k表示序列中的第k个元素，N为序列中元素总数；

X_(α+βi)k＝(iω_k)^α+βiX_k；

其中，

ω_k为X_k中提取的角频率；导数阶数的实部选取范围为0<α<3，导数阶数的虚部选取范围为8<β<11；

a3、对序列{X_(α+βi)k},k＝0,1,...,(N-1)做快速傅里叶逆变换，得到音频信号x(t)的复数阶导数；α为复数阶导数的实部，β为复数阶导数的虚部；

步骤B、根据音频信号的复数阶导数提取鼾声鉴别特征值。

有益效果：

当导数阶数在一定范围内时，使用复数阶导数对音频信号进行处理后，鼾声在复平面以及时间轴和实轴所在平面与手机音乐、敲击声、说话语音等声音都有非常明显得区别，而且这种区别可以通过阈值的方式进行区别。本发明利用这一特点，从音频信号的复数阶导数中提取鼾声鉴别特征值，通过设阈值的方法，降低了算法的复杂度，提高了鼾声检测的准确度。

附图说明

图1为本发明鼾声检测方法的流程示意图；

图2为经复数阶导数处理后的鼾声示意图；其中，(a)是时域波形图，(b)为声音经复数阶导数处理后的三维图形，(c)为图(b)中的三维图形在时间轴和实轴所在平面的投影，(d)图为图(b)中的三维图形在复平面的投影；

图3为经复数阶导数处理后的手机音乐声示意图；其中，(a)是时域波形图，(b)为声音经复数阶导数处理后的三维图形，(c)为图(b)中的三维图形在时间轴和实轴所在平面的投影，(d)图为图(b)中的三维图形在复平面的投影；

图4为经复数阶导数处理后的敲击声示意图；其中，(a)是时域波形图，(b)为声音经复数阶导数处理后的三维图形，(c)为图(b)中的三维图形在时间轴和实轴所在平面的投影，(d)图为图(b)中的三维图形在复平面的投影；

图5为本发明鼾声检测装置的组成示意图。

具体实施方式

本申请人研究表明，当导数阶数在一定范围内时，使用复数阶导数对鼾声信号进行处理后，鼾声信号在复平面以及时间轴和实轴所在平面与手机音乐、敲击声、说话语音等声音都有非常明显得区别，因此，可将鼾声信号在复平面或时间轴与实轴所在平面的投影特征作为鼾声检测所用到的特征，也可将这一特征用到相应的模式识别领域。

例如当导数阶数z＝1+10i时，对音频信号进行复数阶导数处理，获得一系列的效果图。图2为经复数阶导数处理后的鼾声示意图，(a)是鼾声的时域波形图，(b)为经复数阶导数处理后鼾声的三维图形，(c)为(b)图中的三维图形在时间轴和实轴所在平面的投影，(d)图为(b)图中的三维图形在复平面的投影。

为了表现复数阶导数处理的优越性，本发明选取了手机音乐声和敲击声与鼾声信号进行对比。图3和图4分别展示了手机音乐和敲击声的时域波形图、经复数阶导数处理后的三维图形以及它们各自的三维图形在时间轴和实轴所在平面与复平面上的投影。从图中可以看出，经复数阶导数处理后的音频信号呈现出一种“圆柱”形，直观上看，鼾声信号的三维图形更“粗”些。为了得到更直观的表现，将三维图形在时间轴与实轴所在平面、复平面进行投影。明显的看到，在时间轴与实轴所在的平面，鼾声信号的幅值明显高于其它两种声音。在复平面上的投影呈现一种类“圆”形，鼾声信号的“直径”或“面积”明显大于另外两种声音。

从上图可以看出，通过利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点，可以借助阈值的判断方式进行鼾声鉴别。因此，本发明方法的基本过程为：

步骤A、获取待检测音频信号的复数阶导数。

步骤B、利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点，从待检测音频信号的复数阶导数中提取鼾声鉴别特征值。

下面结合附图并举实施例，对本发明进行详细描述。

实施例一

本实施例利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点进行特征提取和鼾声检测。

参见图2、3、4中的(c)，鼾声、手机音乐声和敲击声在时间轴与实轴所在平面的投影上，图形的粗细不同，也就是幅值不同。那么，本实施例的幅值就是指音频信号的复数阶导数在时间轴与实轴所在平面的投影中距离时间轴的距离，即复数阶导数的实部幅值绝对值。为了衡量该数据的大小，采用音频信号的复数阶导数的实部幅值绝对值的平均值作为所述鼾声鉴别特征值，将其与阈值范围进行比较，以判定是否为鼾声。

基于上述分析，本发明首先用复数阶导数对待检测的音频信号进行处理，然后计算得到处理后的音频信号的实部幅值绝对值平均值，作为鼾声鉴别特征值；然后判断该平均值是否在所设阈值范围内，如果在，则认为是鼾声，反之则不是。

图1给出了本发明实施例一的鼾声检测方法的流程图。如图1所示，本发明所述的鼾声检测方法的实施包括以下步骤：

步骤S110、采集音频信号：

由于鼾声信号的能量大多分布在4kHz以内，且鼾声信号具有准周期性的特点，本实施例在获取音频信号时采用8k的采样率，采样精度为16位，且每5秒进行一次鼾声检测判断。

步骤S120、对采集的音频信号进行预处理：

预处理包括对采集的音频信号进行降噪与预加重的处理。降噪本实施例采用基本谱减法进行降噪，预加重是采用一阶的高通滤波器。降噪与预加重是语音处理中常见的预处理方法，这里不做过多的累述。

步骤S130、利用复数阶导数对音频信号进行处理：

现有的鼾声处理方法主要借鉴语音处理的方法，得到的鼾声特征与其它声音区分不明显，为此，本发明提出使用复数阶导数对鼾声信号进行处理。

(1)复数阶导数的定义如下：

对于函数x(t)：

x(t)＝Xe^iωt (1)

其中，ω与X是常数，且0<ω∈R，X∈R，R表示实数集，t是实变量，

那么，x(t)的复数阶导数x^(z)可表示为：

x^(z)＝x^(α+βi)＝(iω)^α+βiXe^iωt (2)

其中，z＝α+βi，α,β∈R。对于式(2)，通常称之为分数阶导数。但是显然，称之为复数阶导数更符合逻辑。

(2)对于一组声音时域信号x(t)进行复数阶导数处理的简单方法如下：

a1、首先对待检测的音频信号x(t)进行快速傅里叶变换(FFT)，这样可以得到如式(1)所示的复数形式Xe^iωt，Xe^iωt的序列表示为：{X_k},k＝0,1,...,(N-1)，k表示序列中的第k个元素，N为快速傅里叶变换后序列中的元素总数。

X_(α+βi)k＝(iω_k)^α+βiX_k (3)

其中，k表示第k个元素；ω_k为X_k中提取的角频率；

a3、对序列{X_(α+βi)k},k＝0,1,...,(N-1)做快速傅里叶逆变换(IFFT)，得到音频信号x(t)的复数阶导数x^(z)(t)，假设得到最后的时域序列表示为：{Y_k},k＝0,1,...,(N-1)。

本申请人研究表明，导数阶数z只有在一定范围内时，才能取得良好的效果，其中，实部0<α<3且虚部8<β<11时判别效果较好。取值时，当α取较大的值时，β应取较小的值；当α取较小的值时，β应取较大的值。图2-图4是导数阶数z＝1+10i得到的效果图。

步骤S140、计算经复数阶导数处理后的音频数据的实部平均值：

当导数阶数z＝1+10i时。假设经复数阶导数处理后所得的时域序列为{Y_k},k＝0,1,...,(N-1)，序列长度为L。那么，实部平均值G可表示为：

上式中，当复阶导数的阶数为z＝1+10i时，经复阶导数处理后的音频数据为10⁶的倍数，为了方便计算以及方便设置阈值，所以除以10⁶。

步骤S150、判断所得平均值G是否在所设阈值范围内：

当导数阶数z＝1+10i时，经复数阶导数处理后，鼾声的实部平均值G一般在0.5～0.7之间，而手机音乐声、敲击声等在0.1～0.3之间。因此，当所述音频信号的实部均值G在0.5～0.7之间(包括端点值)时，则认为是鼾声，否则，则认为不是鼾声。

为了实现上述方法，本实施例还提出了一种鼾声检测装置，如图5所示，该鼾声检测装置包括：

复数阶导数获取模块，用于获取待检测音频信号的复数阶导数；复数阶导数求取中，实部阶数的选取范围为0<α<3，虚部阶数选取范围为8<β<11；取值时，α值越大，则β值越小。

鼾声鉴别特征值提取模块，用于利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点，从待检测音频信号的复数阶导数中提取鼾声鉴别特征值。本实施例中，该模块获取音频信号的复数阶导数的实部幅值绝对值的平均值，作为所述鼾声鉴别特征值。

鼾声判断模块，用于判断所述鼾声鉴别特征值是否在所设阈值范围内；如果是，则判定为鼾声，反之则不是。

实施例二

本实施例利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点进行特征提取和鼾声检测。参见图2、3、4中的(d)，鼾声、手机音乐声和敲击声在复平面的投影上，图的大小不同，该圆的大小可以采用圆形半径来衡量。而圆形半径可以采用信号幅值来计算。对于复平面，信号幅值可以看做是复平面上的点与复平面原点之间的距离。那么，本实施例可以计算在复平面上经复阶导数处理后的音频信号的实部和虚部所组成的点与复平面原点之间距离的平均值，作为所述鼾声鉴别特征值。

本实施例的具体实施步骤与实施例一相同，只是步骤S140的鼾声鉴别特征值的获取方式不同，以及步骤S150所使用的阈值范围不同。

本实施例二的步骤S140在获取鼾声鉴别特征值时，当复数阶导数阶数为z＝1+10i时，假设经复数阶导数处理后所得的时域序列为{Y_k},k＝0,1,...,(N-1)，序列长度为L。那么，本实施例中距离的平均值Q可表示为：

本实施例二的步骤S150为：判断所得平均值Q是否在所设阈值范围内

本申请人研究发现，经复数阶导数处理后，鼾声的距离平均值Q一般在0.61～1.1之间，而手机音乐声、敲击声等在0.2～0.5之间。因此，当所述音频信号的距离均值Q在0.61～1.1之间(包括端点值)时，则认为是鼾声，否则，则认为不是鼾声。

同理，对于鼾声检测装置，鼾声鉴别特征值提取模块的鼾声鉴别特征值的获取方式与实施例一不同，鼾声判断模块所使用的阈值范围与实施例一不同。

实施例三

本发明还提供了一种基于复数阶导数处理的鼾声特征提取方法，包括如下步骤：

步骤A、获取音频信号的复数阶导数；该步骤A包括：

X_(α+βi)k＝(iω_k)^α+βiX_k；

其中，

步骤B、根据音频信号的复数阶导数提取鼾声鉴别特征值。

采用该方法提取出的鼾声鉴别特征值不仅可以用于本发明的鼾声检测过程，还可以用于其他模式识别过程，例如可以作为神经网络的部分输入特征，用以实现与其他声音的区别。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于复数阶导数处理的鼾声特征提取和检测方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述步骤A包括：

X_(α+βi)k＝(iω_k)^α+βiX_k；

其中，

ω_k为X_k中提取的角频率；

3.如权利要求1所述的方法，其特征在于，所述步骤B利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点，提取鼾声鉴别特征值时：

4.如权利要求1所述的方法，其特征在于，所述步骤B利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点，提取鼾声鉴别特征值时：

5.如权利要求1所述的方法，其特征在于，采用8k的采样率采样音频信号，采样精度为16位；并且每5秒进行一次步骤A～C的鼾声检测判断。

6.如权利要求1所述的方法，其特征在于，在执行步骤A之前，进一步对采集的音频信号进行降噪与预加重的预处理。

7.一种基于复数阶导数处理的鼾声特征提取和检测装置，其特征在于，包括：

8.如权利要求7所述的装置，其特征在于，所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点，获取音频信号的复数阶导数的实部幅值绝对值的平均值，作为所述鼾声鉴别特征值。

9.如权利要求7所述的装置，其特征在于，所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点，获取音频信号的复数阶导数与复平面原点之间距离的平均值，作为所述鼾声鉴别特征值。

10.一种基于复数阶导数处理的鼾声特征提取方法，其特征在于，包括：

步骤A、获取音频信号的复数阶导数；该步骤A包括：

X_(α+βi)k＝(iω_k)^α+βiX_k；

其中，

步骤B、根据音频信号的复数阶导数提取鼾声鉴别特征值。