CN110634504B

CN110634504B - 一种鼾声检测方法和装置

Info

Publication number: CN110634504B
Application number: CN201910871659.7A
Authority: CN
Inventors: 王晓东; 赵江波; 李�杰; 周勇; 钟惠波
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2019-09-16
Filing date: 2019-09-16
Publication date: 2021-09-21
Anticipated expiration: 2039-09-16
Also published as: CN110634504A

Abstract

本发明公开了一种鼾声检测方法和装置，所述方法利用音频信号的过零率和共振峰特性，识别鼾声信号；在利用共振峰特性识别鼾声信号时，判断是否满足两个条件；条件L1为：判断最高共振峰处的共振峰频率f_max和带宽W_max的比值Q₁是否在设定范围内；条件L2为：当音频信号存在频率低于频率阈值θ的共振峰P_d时，判断最高峰共振峰与共振峰P_d的峰值之比Q₂是否对应范围内；如果存在共振峰P_d，则当同时满足条件L1和条件L2时，判定当前语音信号满足鼾声的共振峰特性；如果不存在共振峰P_d，则当满足条件L1时，判定当前语音信号满足鼾声的共振峰特性。本发明能够提高鼾声检测的准确度，降低检测的复杂度。

Description

一种鼾声检测方法和装置

技术领域

本发明涉及声音检测领域，具体而言涉及一种鼾声检测方法和装置。

背景技术

打鼾是一种十分普遍的现象，大约有20％～40％的人群患有打鼾症状。打鼾不仅困扰患者、影响同伴，严重时还会对患者的健康造成威胁，影响人们的正常生活。打鼾严重者，会患有睡眠呼吸暂停综合征，在睡眠过程中出现呼吸暂停的现象，导致血液中氧气含量减少，形成一个短时间的缺氧状态。当患者长期处于缺氧状态时，可能会诱发一些慢性疾病：高血压、心肌梗死等，如果缺氧时间超过120秒可能会导致窒息死亡。

目前市场上常见的止鼾产品采用鼾声阈值判断的方法，检测声音的分贝值，当大于阈值时则认为是鼾声，此种方法只适合于安静的环境下，不能区分说话人声音、咳嗽声等声音。还有通过检测声音的周期性来判断是否是鼾声，这种方法成本低，但是抗干扰能力差，难以区分语音以及其它频率相近的声音。

医学上使用多导睡眠仪或是采用整晚声音采集结合功率谱分析方法。前者要求专业人员进行操作，后者虽然准确率高，但是需要的硬件成本高，算法复杂，不能实时检测。两者皆不适合用于民用产品。

因此，设计一种简便、准确率高的鼾声检测方法变得十分重要。

发明内容

有鉴于此，本发明提供了一种鼾声检测方法和装置，提高鼾声检测的准确度，降低检测的复杂度。

为了解决上述技术问题，本发明是这样实现的：

一种鼾声检测方法，利用音频采集设备采集音频信号，检测识别设备对音频信号进行鼾声检测；所述检测识别设备利用音频信号的过零率和共振峰特性，识别鼾声信号；

在利用共振峰特性识别鼾声信号时，判断是否满足条件L1和条件L2；

所述条件L1为：获取最高共振峰处的共振峰频率f_max和带宽W_max的比值Q₁，当Q₁在鼾声对应的第一比值范围内，则认为满足条件L1；

所述条件L2为：当音频信号存在频率低于频率阈值θ的共振峰P_d时，获取最高峰共振峰与共振峰P_d的峰值之比Q₂，当Q₂在鼾声对应的第二比值范围内，则认为满足条件L2；

如果存在共振峰P_d，则当同时满足条件L1和条件L2时，判定当前语音信号满足鼾声的共振峰特性；如果不存在共振峰P_d，则当满足条件L1时，判定当前语音信号满足鼾声的共振峰特性。

优选地，利用过零率筛选鼾声信号为：对音频信号进行加窗分帧处理，求每帧信号的过零率，将设定的判断周期内所有帧信号过零率均值作为音频信号过零率；如果音频信号过零率在所设过零率阈值范围内，则判定当前音频信号满足鼾声的过零率特征。

优选地，利用共振峰特性识别鼾声信号为：

步骤1、从音频信号获取各个共振峰的峰值、频率及带宽；

步骤2、判断音频信号中是否存在频率低于频率阈值θ的共振峰P_d，如果存在，则执行步骤3；否则，执行步骤5；

步骤3、获取最高共振峰与共振峰P_d的峰值之比Q₂；

步骤4、判断比值Q₂是否大于在鼾声对应的第二比值范围内；如果是，判定满足条件L2，执行步骤5；否则，确定当前音频信号不是鼾声；

步骤5、获取音频信号最高共振峰的共振峰频率f_max与带宽W_max的比值Q₁；

步骤6、判断比值Q₁是否在鼾声对应的第一比值范围内；如果是，则满足条件L1，确定当前音频信号满足鼾声的共振峰特性；否则，确定当前音频信号不是鼾声。

优选地，所述利用音频采集设备采集音频信号时，采用8k的采样率；检测识别设备每5秒进行一次鼾声检测判断。

优选地，所述条件L1中，鼾声对应的第一比值范围为与最高共振峰的峰值频率f_max有关，通过试验确定不同峰值频率f_max对应的第一比值范围。

优选地，所述条件L1中，鼾声对应的第一比值范围为与最高共振峰的峰值频率f_max有关，且Q₁＝f_max/W_max，则：

当500Hz≤f_max≤1000Hz时，第一比值范围取(3,∞)；

当1000Hz<f_max≤2000Hz时，第一比值范围取(6,∞)；

当2000Hz<f_max≤3000Hz时，第一比值范围取(10,40)；

当f_max＞3000Hz时，Q₂＝A_max/A_d，A_max为所述最高共振峰的峰值，A_d为所述共振峰P_d的峰值，则第一比值范围取(16.5,∞)。

所述条件L2中，第二比值范围为[10,∞)；

所述频率阈值θ＝500Hz；

在利用过零率识别鼾声时，过零率阈值范围为[40,110]，过零率在过零率阈值范围内被判定为疑似鼾声。

本发明还公开了一种鼾声检测装置，该装置包括信号采集设备和检测识别设备；检测识别设备包括过零率判断模块、共振峰判断模块和确定模块；

所述信号采集设备，用于采集音频信号并转化为数字信号，发送给所述检测识别设备；

所述过零率判断模块，用于提取音频信号的过零率，判断是否满足鼾声的过零率特征；

所述共振峰判断模块，用于提取音频信号的共振峰特性，判断共振峰特性是否满足条件L1和条件L2；所述条件L1为：获取最高共振峰处的共振峰频率f_max和带宽W_max的比值Q₁，当Q₁在鼾声对应的第一比值范围内，则认为满足条件L1；所述条件L2为：当音频信号存在频率低于频率阈值θ的共振峰P_d时，获取最高峰共振峰与共振峰P_d的峰值之比Q₂，当Q₂在鼾声对应的第二比值范围内,则认为满足条件L2；如果存在共振峰P_d，则当同时满足条件L1和条件L2时，判定当前语音信号满足鼾声的共振峰特性；如果不存在共振峰P_d，则当满足条件L1时，判定当前语音信号满足鼾声的共振峰特性；

所述确定模块，用于在音频信号同时满足鼾声的过零率特征和共振峰特性时，判定检测到鼾声。

优选地，所述过零率判断模块对音频信号进行加窗分帧处理，求每帧信号的过零率，将设定的判断周期内所有帧信号过零率均值作为音频信号过零率；如果音频信号过零率在所设过零率阈值范围内，则判定音频信号满足鼾声的过零率特征；所述过零率阈值范围为[40,110]。

优选地，所述共振峰判断模块包括特征值提取子模块、L2条件判断子模块、L1条件判断子模块和综合判断子模块；

特征值提取子模块，用于从音频信号获取各个共振峰的峰值、频率及带宽；

L2条件判断子模块，用于当音频信号存在频率低于频率阈值θ的共振峰P_d时，获取最高峰共振峰与共振峰P_d的峰值之比Q₂；判断比值Q₂是否在鼾声对应的第二比值范围内，如果是则判定满足条件L2；将判定结果告知综合判断子模块；

L1条件判断子模块，用于获取音频信号最高共振峰处的共振峰频率f_max和带宽W_max的比值Q₁；判断比值Q₁是否在鼾声对应的第一比值范围内；如果是，则判定满足条件L1；将判定结果告知综合判断子模块；

综合判断子模块，用于接收来自L2条件判断子模块和L1条件判断子模块的判断结果；如果存在共振峰P_d，则当同时满足条件L1和条件L2时，判定当前语音信号满足鼾声的共振峰特性；如果不存在共振峰P_d，则当满足条件L1时，判定当前语音信号满足鼾声的共振峰特性。

优选地，L2条件判断子模块在判定满足条件L2或者在检测到不存在共振峰P_d时，通知L1条件判断子模块进行处理；L1条件判断子模块在收到通知后，进行L1条件是否满足的判断；

所述综合判断子模块先考虑L2条件判断子模块的判定结果，如果判定结果显示不满足条件L2，则直接判定当前语音信号不满足鼾声的共振峰特性；如果判定结果显示满足条件L2或者不存在共振峰P_d，则进一步考虑L1条件判断子模块的判定结果，如果此时条件L1的判定结果显示满足条件L1，则确定当前音频信号满足鼾声的共振峰特性。

优选地，所述条件L1中，鼾声对应的第一比值范围为与最高共振峰的峰值频率f_max有关；所述共振峰判断模块预存有各种f_max对应的第一比值范围；根据当前语音信号的f_max，提取对应的第一比值范围进行条件L1的判断。

有益效果：

(1)本发明通过获取所采集音频信号的过零率与共振峰特性，并设置相应阈值来实现鼾声的检测，由于鼾声的过零率与共振峰特性与普通语音、咳嗽、敲击、拍手等所造成的声音有很明显的差异，通过判断比较过零率与共振峰特性可以更加精确的确定采集到的音频信号是否是鼾声，提高了鼾声检测的准确率。

(2)在利用共振峰特性识别鼾声信号时，本发明设计了两个比较参数，其中，最大共振峰频率与带宽比值Q₁用于有针对性的从背景音中筛选出鼾声(条件L1)，最大共振峰与低于θ共振峰值的幅度比值Q₂用于排除与鼾声相似的语音(条件L2)，这两个参数的设计能够提高鼾声检测的准确率。

而且，这两个比较参数均是比值，计算简单，从而降低了鼾声检测的难度。

(3)在利用共振峰特性识别鼾声信号时，在一实施例中，先判断音频信号中是否存在频率低于频率阈值θ的共振峰P_d，如果存在，则利用鼾声信号共振峰最高峰和共振峰的峰值比较大的特点，将语音、咳嗽等声音排除；由于环境中，其他声音占较大比例，因此先排除语音的方式，可以尽快获得检测结果，而不用进行更多的判定，从而提高了识别速度。

(4)在针对条件L1设定比值Q₁的范围时，在研究中发现该比值范围与共振峰最高峰对应的峰值频率f_max有关，因此试验确定出不同峰值频率f_max对应的比值范围。在使用时，根据f_max选择合适的比值范围作为判断准则，从而能够有效提高鼾声检测的准确率。

(5)在一实施例中，根据鼾声的周期，与鼾声集中频率区域，采用8k的采样率，并且每5秒进行一次鼾声检测判断；在此条件下，给出了鼾声所对应的Q₁范围、Q₂对应的阈值T以及频率阈值θ的值，采用给定的这些值，可以非常准确的识别出鼾声。

附图说明

图1为本发明鼾声检测方法的流程示意图；

图2为图1中步骤5共振峰特性判断的流程示意图；

图3为鼾声过零率示意图；(a)为鼾声波形，(b)为对应的过零率波形；

图4为鼾声共振峰特性曲线；(a)为鼾声波形，(b)为对应的功率谱曲线；

图5为非鼾声共振峰特性曲线；(a)为非鼾声波形，(b)为对应的功率谱曲线；

图6为本发明鼾声检测装置的组成示意图；

图7为图6中共振峰判断模块的组成示意图。

具体实施方式

本发明提供了一种鼾声检测方案，其基本思想是：利用音频信号的过零率和共振峰特性识别鼾声信号。其中，在利用过零率识别鼾声信号时，根据过零率是否在设定范围内来识别。在利用共振峰特性识别鼾声信号时，考虑两个方面的内容：

一方面是，本申请人发现，鼾声与说话语音、咳嗽等声音的共振峰范围不同。说话语音、咳嗽等声音的共振峰特性中，能量相对集中在某个频率以下，通过试验测定该频率阈值为500Hz，即低于500Hz的共振峰频率对应的峰值很高；而在鼾声的共振峰特性中，能量相对集中在500Hz以上。因此可以将500Hz作为中间界限。但是有些鼾声可能也落入了共振峰低于500Hz的范围，但是本申请人发现，即使存在低于500Hz的共振峰频率，与之对应的峰值也很低，至少是低于说话语音、咳嗽等声音的共振峰峰值。因此可以采用共振峰最高峰与各共振峰的峰值比作为一个识别条件。也就是说，当存在频率低于500Hz的共振峰时，利用共振峰最高峰与该共振峰的峰值比来区分鼾声和一般说话声、咳嗽等语音；根据鼾声的这一特性，可以更加精确的排除语音的干扰；

另一方面，本申请人研究发现，鼾声共振峰特性中峰值最高点对应的共振峰频率的带宽在200Hz以内，而其他一些与鼾声共振峰频率相近的声音信号的带宽都大于200Hz，大都集中在300Hz左右，根据鼾声的这一特性，可以实现更加精确的鼾声检测。因此，本发明将峰值最高点对应的共振峰频率与带宽的比值作为一个区别特征，将鼾声从音频信号中识别出来。

基于上述分析，下面结合附图并举实施例，对本发明进行详细描述。

本实施例中，先进行过零率识别，再进行共振峰特性判断，因为过零率算法更简单，可以在代价更小的情况下排除不可能为鼾声的音频信号。在实际中，可以先进行共振峰特性的识别，或者过零率和共振峰特性并行识别，过零率和共振峰特性均符合，才认定为鼾声。但是并行识别的效率没有串行识别效率高，因为两个特征都要处理一遍。

图1为本发明鼾声检测方法的流程图。如图1所示，该方法包括如下步骤：

步骤1、采集音频信号：

利用音频采集设备采集音频信号。由于鼾声信号的能量大多分布在4kHz以内，且鼾声信号具有准周期性的特点，因此本发明的音频采集设备在获取音频信号时采用2倍于鼾声能量分布区域的采样率，即采用8k的采样率，在实际中可以采用2～3倍于鼾声频率作为采样率；且根据鼾声周期，每5秒进行一次鼾声检测判断。

音频采集设备利用麦克风采集得到原始音频信号之后，得到的是模拟的音频信号，需要将模拟信号转换为数字信号，后续步骤所处理的音频信号是指此处所得的数字信号。

以下步骤2～3为利用过零率筛选鼾声信号。

步骤2、计算所采集音频信号的过零率。

过零率(也称短时平均过零率)是指一帧语音中语音信号波形穿过横轴的次数。

本步骤具体实现为：对音频信号进行加窗分帧处理。在这一过程中，优选帧长为200ms，帧移为80ms，优选汉宁窗；假设在一个判断周期内采集所得音频数字信号为x(n)(也可以是想要进行鼾声判定的任意一段语音信号)，则分帧后每一帧内音频信号采用y_i(n)表达，其中i表示第i帧。获取y_i(n)内语音信号波形穿过横轴的次数，即该帧的过零率。图3为短时鼾声波形及其过零率波形示意图。图3(a)为鼾声波形，图3(b)为对应的过零率波形。

本发明实施例采用式(1)所示计算一帧音频信号的过零率。

y_i(n)y_i(n+1)<0 (1)

上式(1)表达的意思是，相邻两数据点一正一负，则二者之间连线肯定过零，过零率+1。

假设在设定的判断周期内(本实施例设为5s)，信号x(n)分帧后帧数为f_n，各帧的过零率为g_k，其中，k＝1,2,3...f_n。则一段音频信号的过零率为音频信号各帧信号的过零率的均值G，可表示为：

步骤3、判断音频信号的过零率G是否在设定的过零率阈值范围内，如果是，则判定音频信号满足鼾声的过零率特征，需要进一步判定共振峰特性，转入步骤4；否则，判定当前音频信号为非鼾声信号，而是一些其他声音，如说话语音、敲击等噪音。

在本实施例中，鼾声的过零率阈值范围为40～110。本申请人研究发现，鼾声的过零率基本在40～80之间，对于一些打鼾时呼气时间较长的患者，过零率会高于80。而说话语音、物体碰撞、敲击等造成的噪声，它们的过零率都相对较小，大都集中在30以内。

对于那些与鼾声过零率相近的声音，可通过以下步骤4～5的共振峰特性判断进行区分。

步骤4、获取音频信号的共振峰特性。

针对步骤1所得的音频数字信号，将其转化为功率谱，从功率谱中提取各共振峰的峰值、频率和带宽。可以采用线性预测系数法(LPC)实现音频信号到功率谱的转化。

优选地，在提取共振峰之前，可以进一步对输入音频数字信号进行预加重，这里预加重是采用一阶的高通滤波器对音频信号进行滤波，起到对音频信号高频提升的作用。为了更加精确的计算出共振峰频率和它的带宽，本鼾声检测方法的实施例采用线性预测系数法所提供的抛物线内插的方法计算共振峰频率和它的带宽。

步骤5、判断音频信号的共振峰特性是否鼾声的共振峰特性，如果是，则判定为音频信号为鼾声；否则，判定音频信号不是鼾声。

图2为本步骤5进行共振峰特性判断的具体实现过程，在判断过程中，涉及到的两个条件为：

条件L1：获取最高共振峰处的共振峰频率f_max和带宽W_max的比值Q₁，当Q₁在鼾声对应的第一比值范围内，则认为满足条件L1；

条件L2：当音频信号存在频率低于频率阈值θ的共振峰P_d时，获取最高峰共振峰与共振峰P_d的峰值之比Q₂，当Q₂在鼾声对应的第二比值范围内，则认为满足条件L2；如果不存在共振峰P_d，则不考虑本条件L2。

参见图2，上述共振峰特性的判断过程包括如下步骤：

步骤501、判断音频信号的共振峰中是否存在低于频率阈值θ＝500Hz的共振峰，若存在，则将该共振峰记为P_d，执行步骤502；否则，执行步骤504。

本实施例中选择频率阈值θ＝500Hz。该频率阈值500Hz适合大多数的打鼾者。优选地，可以针对不同使用者确定更加适用的频率阈值，这样鼾声的判断效果更佳。

步骤502、获取最高共振峰的峰值A_max与共振峰P_d的峰值A_d，计算A_max与A_d的比值Q₂。本发明并不限定该比值Q₂是A_max/A_d还是A_d/A_max，只要测定不同的阈值范围即可。

步骤503、判断比值Q₂是否处于鼾声对应的第二比值范围内；该第二比值范围是预先通过试验数据分析确认的鼾声和非鼾声之间的阈值。如果是，则判定满足条件L2，说明当前音频有别于说话语音、咳嗽等声音，极有可能是鼾声，此时执行步骤504，继续进行判断；否则，确定当前音频信号不是鼾声。

本发明优选实施例中，令Q₂＝A_max/A_d，对于鼾声来说，由于A_d较低，Q₂将会较高，那么可以设定一个下限T，因此第二比值范围是[T,∞)。当Q₂大于T时，可以判定符合鼾声共振峰特征。其中，T可以预先通过试验确定，优选地取T＝10，那么第二比值范围就是[10,∞)。参见图4和图5，图4中的(a)为鼾声波形，(b)为对应的功率谱曲线。从图4(b)中可以看出，当鼾声功率谱中存在低于500Hz共振峰时，其共振峰幅值非常小，即A_d较低。而图5(b)中示出的非鼾声功率谱中存在低于500Hz共振峰的幅值很高。

在实际中，也可以采用Q₂＝A_d/A_max作为参考值。对于鼾声来说，由于A_d较低，Q₂将会较小，那么Q₂小于阈值T’才可能是鼾声，因此判断条件是Q₂小于T’，也就是第二比值范围是(0，T']。T’可以通过预先进行试验获得。

步骤504、获取音频信号最高共振峰P_max处的共振峰频率f_max和带宽W_max，计算f_max与W_max的比值Q₁。本发明并不限定该比值Q₁是f_max/W_max还是W_max/f_max，只要测定不同的阈值范围即可。

步骤505、判断比值Q₁是否在鼾声对应的第一比值范围内；如果是，则当前音频信号满足鼾声共振峰特性，由于在本实施例中前面已经进行了过零率的判断，因此这里可以确定出当前音频信号为鼾声信号；如不满足所设第一比值范围，则确定当前音频信号为非鼾声信号。

在研究中发现，上述第一比值范围与共振峰最高峰对应的峰值频率f_max有关，因此试验确定出不同峰值频率f_max对应的第一比值范围。在使用时，根据f_max选择合适的比值范围作为判断准则，从而能够有效提高鼾声检测的准确率。

本优选实施例中，令Q₁＝f_max/W_max，共振峰频率与带宽的比值是品质因子，可表明声带振动衰减的快慢。在采用8k的采样率，并且每5秒进行一次鼾声检测判断的情况下，获得各f_max对应的第一比值范围为：

当500Hz≤f_max≤1000Hz时，第一比值范围取(3,∞)；

当1000Hz<f_max≤2000Hz时，第一比值范围取(6,∞)；

当2000Hz<f_max≤3000Hz时，第一比值范围取(10,40)；

当f_max＞3000Hz时，第一比值范围取(16.5,∞)

如果令Q₁＝W_max/f_max则需要重新确定各f_max对应的第一比值范围。

至此，本流程结束。

上述本实施例中，步骤501～505利用共振峰特性识别鼾声信号时，先判断条件L2是否成立，也就是先判断音频信号中是否存在频率低于频率阈值θ的共振峰P_d，如果存在，则利用Q₂将语音、咳嗽等声音排除。由于环境中，其他声音占较大比例，因此先排除语音的方式，可以尽快获得检测结果，而不用进行更多的判定，从而提高了识别速度。在实际中，也可以先判断条件L1是否成立，再判断L2是否成立，或者二者并行判断。

基于上述方案，本发明还提供了一种鼾声检测装置，如图6所示，其包括信号采集设备和检测识别设备。其中，检测识别设备包括过零率判断模块、共振峰判断模块和确定模块。

信号采集设备，用于采集音频信号并转化为数字信号，发送给所述检测识别设备中的过零率判断模块和共振峰判断模块。

过零率判断模块，用于提取音频信号的过零率，判断是否满足鼾声的过零率特征。本实施例中，过零率判断模块首先对音频信号进行加窗分帧处理，然后求每帧信号的过零率，将设定的判断周期内所有帧信号过零率均值作为音频信号过零率；如果音频信号过零率在所设过零率阈值范围内，则判定音频信号满足鼾声的过零率特征。其中，过零率阈值范围取40～110为优选取值。

共振峰判断模块，用于提取音频信号的共振峰特性，判断共振峰特性是否同时满足条件L1和条件L2。其中，条件L1为：获取最高共振峰处的共振峰频率f_max和带宽W_max的比值Q₁，当Q₁在鼾声对应的第一比值范围内，则认为满足条件L1；条件L2为：当音频信号存在频率低于频率阈值θ的共振峰P_d时，获取最高峰共振峰与共振峰P_d的峰值之比Q₂，当Q₂在鼾声对应的第二比值范围内,则认为满足条件L2。Q₁和Q₂的具体形式，以及第一比值范围和第二比值范围的设定参见上文描述。如果存在共振峰P_d，则当同时满足条件L1和条件L2时，判定当前语音信号满足鼾声的共振峰特性；如果不存在共振峰P_d，则当满足条件L1时，判定当前语音信号满足鼾声的共振峰特性。

优选地，如前所述，在条件L1中，鼾声对应的第一比值范围为与最高共振峰的峰值频率f_max有关；本共振峰判断模块预存有各种f_max对应的第一比值范围；根据当前语音信号的f_max，提取对应的第一比值范围进行条件L1的判断。

确定模块，用于在音频信号同时满足鼾声的过零率特征和共振峰特性时，判定检测到鼾声。

在一优选实施例中，先由过零率判断模块进行判断，当其判定音频信号不满足鼾声的过零率特征时，直接判定为非鼾声，不进行共振峰特征判断；只有在判定音频信号满足鼾声过零率特征时，才通知共振峰判断模块执行共振峰特征判断。因为过零率算法更简单，这样做通过过零率排除不可能为鼾声的音频信号后，不再执行后续算法，可以减小计算代价。

参见图7，共振峰判断模块包括特征值提取子模块、L2条件判断子模块、L1条件判断子模块和综合判断子模块。

特征值提取子模块，用于从音频信号获取各个共振峰的峰值、频率及带宽。

L2条件判断子模块，用于判断音频信号中是否存在频率低于频率阈值θ的共振峰P_d；如果存在P_d，则获取最高共振峰P_max的峰值A_max和共振峰P_d的峰值A_d，计算A_max与A_d的比值Q₂；判断比值Q₂是否在鼾声对应的第二比值范围内，如果是则判定满足条件L2；如果不在第二比值范围内则判定不满足条件L2。此外，如果就不存在共振峰P_d，则不考虑本条件L2。该L2条件判断子模块将判定结果告知综合判断子模块。

L1条件判断子模块，用于获取音频信号最高共振峰P_max处的共振峰频率f_max和带宽W_max，计算f_max与W_max的比值Q₁；判断比值Q₁是否在鼾声对应的第一比值范围内；如果是，则判定满足条件L1；否则，不满足条件L1。将判定结果告知综合判断子模块。

在本发明优选实施方式中，先判断条件L2，再判断L1。那么L2条件判断子模块在判定满足条件L2或者在检测到不存在共振峰P_d后，通知L1条件判断子模块进行处理。L1条件判断子模块也仅在得到L2条件判断子模块的通知后，才执行其L1条件是否满足的判断的操作。同时，综合判断子模块也会先获得L2条件判断子模块的判定结果，如果条件L2不满足，则直接判定当前语音信号不满足鼾声的共振峰特性；如果判定结果显示满足条件L2或者不存在共振峰P_d，则进一步考虑L1条件判断子模块的判定结果，如果此时条件L1的判定结果显示满足条件L1，则确定当前音频信号满足鼾声的共振峰特性；否则，确定不满足鼾声的共振峰特性。将是否符合共振峰特性的判断结果发送给确定模块，确定模块会获得最后的判定结果。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种鼾声检测方法，利用音频采集设备采集音频信号，检测识别设备对音频信号进行鼾声检测；其特征在于，所述检测识别设备利用音频信号的过零率和共振峰特性，识别鼾声信号；当所述音频信号同时满足鼾声的过零率特征和共振峰特性时，判定检测到鼾声；

2.如权利要求1所述的方法，其特征在于，利用过零率筛选鼾声信号为：对音频信号进行加窗分帧处理，求每帧信号的过零率，将设定的判断周期内所有帧信号过零率均值作为音频信号过零率；如果音频信号过零率在所设过零率阈值范围内，则判定当前音频信号满足鼾声的过零率特征。

3.如权利要求1所述的方法，其特征在于，当所述音频信号满足过零率特征时，利用共振峰特性识别鼾声信号为：

步骤1、从音频信号获取各个共振峰的峰值、频率及带宽；

步骤3、获取最高共振峰与共振峰P_d的峰值之比Q₂；

4.如权利要求1所述的方法，其特征在于，所述利用音频采集设备采集音频信号时，采用8k的采样率；检测识别设备每5秒进行一次鼾声检测判断。

5.如权利要求1所述的方法，其特征在于，所述条件L1中，鼾声对应的第一比值范围为与最高共振峰的峰值频率f_max有关，通过试验确定不同峰值频率f_max对应的第一比值范围。

6.如权利要求4所述的方法，其特征在于，所述条件L1中，鼾声对应的第一比值范围为与最高共振峰的峰值频率f_max有关，且Q₁＝f_max/W_max，则：

当500Hz≤f_max≤1000Hz时，第一比值范围取(3,∞)；

当1000Hz＜f_max≤2000Hz时，第一比值范围取(6,∞)；

当2000Hz＜f_max≤3000Hz时，第一比值范围取(10,40)；

当f_max＞3000Hz时，Q₂＝A_max/A_d，A_max为所述最高共振峰的峰值，A_d为所述共振峰P_d的峰值，则第一比值范围取(16.5,∞)；

所述条件L2中，第二比值范围为[10,∞)；

所述频率阈值θ＝500Hz；

7.一种鼾声检测装置，其特征在于，该装置包括信号采集设备和检测识别设备；检测识别设备包括过零率判断模块、共振峰判断模块和确定模块；

8.如权利要求7所述的装置，其特征在于，所述过零率判断模块对音频信号进行加窗分帧处理，求每帧信号的过零率，将设定的判断周期内所有帧信号过零率均值作为音频信号过零率；如果音频信号过零率在所设过零率阈值范围内，则判定音频信号满足鼾声的过零率特征；所述过零率阈值范围为[40,110]。

9.如权利要求7所述的装置，其特征在于，所述共振峰判断模块包括特征值提取子模块、L2条件判断子模块、L1条件判断子模块和综合判断子模块；

10.如权利要求9所述的装置，其特征在于，L2条件判断子模块在判定满足条件L2或者在检测到不存在共振峰P_d时，通知L1条件判断子模块进行处理；L1条件判断子模块在收到通知后，进行L1条件是否满足的判断；

11.如权利要求7所述的装置，其特征在于，所述条件L1中，鼾声对应的第一比值范围为与最高共振峰的峰值频率f_max有关；所述共振峰判断模块预存有各种f_max对应的第一比值范围；根据当前语音信号的f_max，提取对应的第一比值范围进行条件L1的判断。