CN111613210A

CN111613210A - 一种各类呼吸暂停综合征的分类检测系统

Info

Publication number: CN111613210A
Application number: CN202010643345.4A
Authority: CN
Inventors: 程思一; 李文钧; 岳克强; 孙洁; 刘昊; 潘成铭
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2020-07-06
Filing date: 2020-07-06
Publication date: 2020-09-01

Abstract

本发明公开了一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，属于鼾声检测及疾病判别领域；包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块，所述音频采集模块，用于采集被测患者整晚睡眠状态时音频；所述鼾声提取模块，用于提取完整音频中所有的鼾声段音频；所述特征提取模块，用于对采集得到的鼾声段进行特征提取；所述鼾声识别模块，用于使用基于EfficientNeT神经网络的模型对所有的鼾声段进行各类鼾声的自动识别与检测；所述统计判断模块，用于对各类鼾声情况的进行统计，并依据AHI指数完成对各类呼吸暂停综合征的分类检测。

Description

一种各类呼吸暂停综合征的分类检测系统

技术领域

本发明涉及鼾声检测及疾病判别领域，具体涉及一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统。

背景技术

睡眠呼吸暂停综合征(OSAHS)是一种睡眠时候呼吸停止的睡眠障碍，表现为在连续7h睡眠中发生30次以上的呼吸暂停，每次气流中止10s以上(含10s)，或平均每小时低通气次数(呼吸紊乱指数)超过5次，而引起慢性低氧血症及高碳酸血症的临床综合征。一般可以分为中枢型、阻塞型及混合型。该病症因为反复发作的低血氧、高碳酸血症会出现神经功能失调，儿茶酚胺、内皮素及肾素-血管紧张素系统失调，内分泌功能紊乱及血液动力学改变等情况，更严重甚至会危及生命。因此，对呼吸暂停综合征的及早诊断和治疗是十分关键的。

而对于睡眠呼吸暂停综合征来说，中枢型、阻塞型及混合型呼吸暂停综合征的病因及危害都各不相同。阻塞性睡眠呼吸暂停(obstructive sleep apnea hyperpnoeasyndrome简称OSAHS)，即在睡眠中因上气道阻塞引起呼吸暂停，表现为口鼻腔气流停止而胸腹呼吸动作尚存在。是一种累及多系统并造成多器官损害的睡眠呼吸疾病，是高血压、冠心病、心律失常、脑卒中等多种疾病的独立危险因素。中枢性睡眠呼吸暂停(central sleepapnea syndrome简称CSAS)，即口鼻腔气流和胸腹呼吸动作同时停止。主要由于中枢神经系统的呼吸中枢功能障碍，或支配呼吸肌的神经、呼吸肌病变，虽然气道可能无堵塞，但呼吸机不能正常工作导致呼吸停止。混合性睡眠呼吸暂停(mixed sleep apnea syndrome简称MSAS)，即上述两者并存，以中枢性呼吸暂停开始，继之表现为阻塞性睡眠呼吸暂停。睡眠中潮气量减小，即呼吸气流降低超过正常气流强度的50％以上，伴血氧饱和度下4％以上，称为呼吸不全或低通气。因此为了更好地治疗，需要能够准确地判别出各类的呼吸暂停综合征。

根据调研和研究表明，现阶段对于OSAHS的诊断，绝大多数医院使用的是专用的诊断装置-多导睡眠监测仪(PSG)，这是一个穿戴式的复合设备，依靠贴在人身体上的电极，监测佩戴者的脑电、心电、眼电、肌电、胸腹式呼吸运动、鼾声、脉搏、血氧饱和度、脉搏波、呼吸频率、体位等多维数据，综合评定佩戴者的健康状况。虽然该装置的准确可靠，但是有着携带不便、价格高昂、影响睡眠等诸多缺点，使得大部分患者不能得到及时地诊断。而鉴于鼾声的产生与呼吸道的生理结构关系紧密，鼾声极有可能能够反映出患者呼吸道发生病变的一些情况，并且有研究表明各类OSAHS患者的鼾声声存在一定的差异，因此可以根据鼾声快捷判别患者的呼吸暂停综合征病变原因。而EfficientNet是谷歌在2019年提出的一项新型模型，使用一种简单但高效的复合系数(compound coefficient)以更加结构化的方式扩展CNN。与任意扩展网络维度(如宽度、深度、分辨率)的传统方法不同，该新模型使用固定的一组缩放系数扩展每个维度，极大地提升了模型的准确率和效率，对于鼾声分类上可以起到优异的效果。

发明内容

本发明旨在针对现有技术存在的缺点与不足，提供一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统。该系统可以提取被测患者的鼾声事件，并通过高效的神经网络对鼾声事件进行判别分类，从而判断出患者的呼吸暂停综合征种类。具体技术方案如下：

一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块，

所述音频采集模块，用于采集被测患者整晚睡眠状态时音频；

所述鼾声提取模块，用于提取完整音频中所有的鼾声段音频；

所述特征提取模块，用于对采集得到的鼾声段进行特征提取；

所述鼾声识别模块，用于使用基于EfficientNeT神经网络的模型对所有的鼾声段进行各类鼾声的自动识别与检测；

所述统计判断模块，用于对各类鼾声情况的进行统计，并依据AHI指数完成对各类呼吸暂停综合征的分类检测。

进一步的，所述音频采集模块，通过麦克风阵列采集被测患者整晚睡眠状态时音频。

进一步的，所述鼾声提取模块，通过端点检测识别出鼾声段和无声段，提取出鼾声段信号，使用的是低信噪比下基于谱熵的端点检测算法。

进一步的，所述特征提取模块对音频进行预加重、分帧加窗处理，提取梅尔倒谱系数(MFCC)；首先利用一阶高通FIR滤波器完成睡眠声信号的预加重，分帧时选择帧长为20ms,帧移为10ms、50％的重叠率；MFCC特征为由人耳对不同频率的声波有不同的听觉敏感度的启发提出来的特征，特征参数提取过程经过预处理，离散傅里叶变换后计算语音信号的功率谱，再通过一组Mel尺度的三角形滤波器组对频谱进行平滑化，最后计算每个滤波器组输出的对数能量：

得到每个滤波器组输出的对数能量s(m)后经离散余弦变换得到MFCC系数C(n)，其中Xa(k)表示各帧信号进行快速傅里叶变换得到的频谱并取模平方得到语音信号的功率谱；H(k)表示能量谱通过三角滤波器得到的频率响应：

进一步的，所述鼾声识别模块，选用tensorflow框架运行谷歌的EfficientNeT神经网络，根据数据对网络进行微调，使用Swish激活函数，其公式如下：

f(x)＝x·sigmoid(βx)

β是个常数或可训练的参数。

使用保存好的模型对正常鼾声、阻塞暂停鼾声、中枢暂停鼾声、混合暂停鼾声的四分类，对呼吸暂停低通气综合征各类鼾声的自动识别与检测；具体包括：训练数据为四类，分别是经过PSG确认的非呼吸暂停相关鼾声、阻塞型呼吸暂停相关鼾声、中枢型呼吸暂停相关鼾声以及混合型呼吸暂停相关鼾声，将这四类数据输入到神经网络进行识别捕捉相关特征之间的联系和区别，得到最终训练模型，完成对各类鼾声的自动识别。

进一步的，所述统计判断模块，将被测患者的所有鼾声段音频提取出的MFCC作为网络输入，得出各类鼾声统计，并根据AHI指数判别被测患者的呼吸暂停综合征具体情况。

本发明相对于现有技术具有如下的优点和效果：

1.本发明方法及系统有着价格低廉，易于携带且不影响被测患者睡眠等优势，可以适配绝大部分呼吸暂停综合征患者。

2.本发明方法及系统根据呼吸暂停综合征种类划分鼾声类型：正常鼾声、阻塞型呼吸暂停鼾声、中枢型呼吸暂停鼾声、混合型呼吸暂停鼾声，研究四类鼾声的特征差异，较精确的实现了四类鼾声的自动分类，并综合各类鼾声情况以及AHI指数，可以较为准确地实现被测患者的呼吸暂停综合征情况，便于医生对症治疗。

附图说明

图1为本申请实施例提供的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统的检测流程示意图。

图2为申请实施例提供的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统的系统框图。

具体实施方式

为了使本发明的目的、技术方案以及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不限于本发明。

如图1所示，本发明的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块。

所述音频采集模块，用于采集被测患者整晚睡眠状态时音频。具体为通过麦克风阵列采集被测患者整晚睡眠状态时音频，麦克风按照指定要求排列，使用改进的自适应波束形成算法，实现采集音频的去混响，语音增强。患者只需将设备放置在床边，系统就会自动采集音频信号并将数据上传至服务器端。

所述鼾声提取模块，用于提取完整音频中所有的鼾声段音频。具体为通过端点检测技术识别出鼾声段和无声段，提取出鼾声段信号，使用的是低信噪比下基于谱熵的端点检测算法，可以精确判断出鼾声段信号，并通过算法脚本自动截取出鼾声段信号。谱熵的算法如下：对快速傅立叶变换(FFT)进行充分利用，从而得到每一帧信号的频谱[Sn＝|x(n)|²]，在此各个频谱谱向量的系数代表了此帧信号在该频率点的大小分布情况。其次对每一帧的每个频谱分量在每帧的总能量中所占比例进行运算，其计算结果认为是信号能量集中在某频率点的概率。即通过下式的概率密度函数计算熵：

s(f_i)为信号是是s(n)经过FFT变换后的频谱分量，N表示FFT变化长度，p_i表示相应的概率函数，i为FFT变换的频率索引。

所述特征提取模块，用于对采集得到的鼾声段进行特征提取。具体为对音频进行预加重、分帧加窗处理，提取梅尔倒谱系数(MFCC)。首先利用一阶高通FIR滤波器完成睡眠声信号的预加重，分帧时选择帧长为20ms,帧移为10ms、50％的重叠率；MFCC特征为由人耳对不同频率的声波有不同的听觉敏感度的启发提出来的特征，特征参数提取过程经过预处理，离散傅里叶变换后计算语音信号的功率谱，再通过一组Mel尺度的三角形滤波器组对频谱进行平滑化，从而避免特征参数受到语音的音调高低的影响，最后计算每个滤波器组输出的对数能量：

所述鼾声识别模块，用于使用EfficientNeT神经网络及设置训练参数、方案，具体包括：选用tensorflow框架运行谷歌的EfficientNeT神经网络，根据数据对网络进行微调，使用Swish激活函数，其公式如下：

f(x)＝x·sigmoid(βx)

β是个常数或可训练的参数。Swish具备无上界有下界、平滑、非单调的特性。Swish在深层模型上的效果优于常用的ReLU。例如，仅仅使用Swish单元替换ReLU就能把MobileNASNetA在ImageNet上的top-1分类准确率提高0.9％，Inception-ResNet-v的分类准确率提高0.6％。选择softmax函数作为输出预测结果概率函数，使用categorical_crossentropy作为多分类损失函数，优化器选择为Adam，衡量指标为精确度(acc)，使用学习率动态调整方案，以及使用5折交叉验证增强稳定性；网络训练参数包括：初始学习率lr＝0.0001、dropout＝0.5、train-epoch＝100，batch-size＝128。

所述统计判断模块，用于对各类鼾声情况的进行统计，并依据AHI指数完成对各类呼吸暂停综合征的分类检测。具体包括：将被测患者的所有鼾声段音频提取出的MFCC作为网络输入，得出各类鼾声统计，并根据AHI指数判别被测患者的呼吸暂停综合征具体情况。

本系统使用的训练数据是采集的经过PSG设备和资深医生诊断过的各类呼吸暂停患者的睡眠鼾声数据，将PSG测得的各类呼吸暂停时间段提取出特征最明显的呼吸暂停段后鼾声，经过标注后作为四分类网络的输入进行训练：

确定训练样本集D＝{(X₁,y₁),(X₂,y₂),...,(X_n,y_n)},y_i∈{1,2，3，4}，X表示由呼吸暂停段后鼾声提取的MFCC特征组成的特征矩阵，y表示各类呼吸暂停事件标签，分别取值为0(正常鼾声)、1(阻塞鼾声)、2(中枢鼾声)和4(混合鼾声)，n表示训练样本数；

采用EfficientNet神经网络对提取得到的特征数据进行训练，建立特征之间的区别和联系的模型，经过数据检测，该模型对各类呼吸暂停综合征患者都有着良好的识别率；

本系统提供了数据传输接口和云端服务器，用于数据传输以及处理，同时，本系统的结果支持显示于pc端与手机端，可以快捷地查看被测患者的鼾声分析情况。

Claims

1.一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块，其特征在于：

2.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，其特征在于：所述音频采集模块，通过麦克风阵列采集被测患者整晚睡眠状态时音频。

3.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，其特征在于：所述鼾声提取模块，通过端点检测识别出鼾声段和无声段，提取出鼾声段信号，使用的是低信噪比下基于谱熵的端点检测算法。

4.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，其特征在于：所述特征提取模块对音频进行预加重、分帧加窗处理，提取梅尔倒谱系数(MFCC)；首先利用一阶高通FIR滤波器完成睡眠声信号的预加重，分帧时选择帧长为20ms,帧移为10ms、50％的重叠率；MFCC特征为由人耳对不同频率的声波有不同的听觉敏感度的启发提出来的特征，特征参数提取过程经过预处理，离散傅里叶变换后计算语音信号的功率谱，再通过一组Mel尺度的三角形滤波器组对频谱进行平滑化，最后计算每个滤波器组输出的对数能量：

5.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，其特征在于：所述鼾声识别模块，选用tensorflow框架运行谷歌的EfficientNeT神经网络，根据数据对网络进行微调，使用Swish激活函数，其公式如下：

f(x)＝x·sigmoid(βx)

β是个常数或可训练的参数。

6.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统，其特征在于：

所述统计判断模块，将被测患者的所有鼾声段音频提取出的MFCC作为网络输入，得出各类鼾声统计，并根据AHI指数判别被测患者的呼吸暂停综合征具体情况。