CN111613210A - 一种各类呼吸暂停综合征的分类检测系统 - Google Patents
一种各类呼吸暂停综合征的分类检测系统 Download PDFInfo
- Publication number
- CN111613210A CN111613210A CN202010643345.4A CN202010643345A CN111613210A CN 111613210 A CN111613210 A CN 111613210A CN 202010643345 A CN202010643345 A CN 202010643345A CN 111613210 A CN111613210 A CN 111613210A
- Authority
- CN
- China
- Prior art keywords
- snore
- module
- apnea
- neural network
- efficientnet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000002859 sleep apnea Diseases 0.000 title claims abstract description 36
- 206010041235 Snoring Diseases 0.000 claims abstract description 110
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 208000008784 apnea Diseases 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 208000003417 Central Sleep Apnea Diseases 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000009432 framing Methods 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 6
- 230000000414 obstructive effect Effects 0.000 claims description 5
- 230000000903 blocking effect Effects 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 210000005069 ears Anatomy 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000037433 frameshift Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 201000010099 disease Diseases 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 208000001797 obstructive sleep apnea Diseases 0.000 description 6
- 230000029058 respiratory gaseous exchange Effects 0.000 description 5
- 230000000241 respiratory effect Effects 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 230000004064 dysfunction Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 231100000915 pathological change Toxicity 0.000 description 3
- 230000036285 pathological change Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 206010020591 Hypercapnia Diseases 0.000 description 2
- 206010021079 Hypopnoea Diseases 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 210000003019 respiratory muscle Anatomy 0.000 description 2
- 210000002345 respiratory system Anatomy 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 101100153586 Caenorhabditis elegans top-1 gene Proteins 0.000 description 1
- 206010008190 Cerebrovascular accident Diseases 0.000 description 1
- 102000002045 Endothelin Human genes 0.000 description 1
- 108050009340 Endothelin Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010021133 Hypoventilation Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 101100370075 Mus musculus Top1 gene Proteins 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 206010067775 Upper airway obstruction Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006793 arrhythmia Effects 0.000 description 1
- 206010003119 arrhythmia Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000003943 catecholamines Chemical class 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 208000035850 clinical syndrome Diseases 0.000 description 1
- 208000020020 complex sleep apnea Diseases 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- ZUBDGKVDJUIMQQ-UBFCDGJISA-N endothelin-1 Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)NC(=O)[C@H]1NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](C(C)C)NC(=O)[C@H]2CSSC[C@@H](C(N[C@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N2)=O)NC(=O)[C@@H](CO)NC(=O)[C@H](N)CSSC1)C1=CNC=N1 ZUBDGKVDJUIMQQ-UBFCDGJISA-N 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000004 hemodynamic effect Effects 0.000 description 1
- 208000018875 hypoxemia Diseases 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 201000006646 mixed sleep apnea Diseases 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000036454 renin-angiotensin system Effects 0.000 description 1
- 230000036391 respiratory frequency Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 208000020685 sleep-wake disease Diseases 0.000 description 1
- 238000002636 symptomatic treatment Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明公开了一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,属于鼾声检测及疾病判别领域;包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块,所述音频采集模块,用于采集被测患者整晚睡眠状态时音频;所述鼾声提取模块,用于提取完整音频中所有的鼾声段音频;所述特征提取模块,用于对采集得到的鼾声段进行特征提取;所述鼾声识别模块,用于使用基于EfficientNeT神经网络的模型对所有的鼾声段进行各类鼾声的自动识别与检测;所述统计判断模块,用于对各类鼾声情况的进行统计,并依据AHI指数完成对各类呼吸暂停综合征的分类检测。
Description
技术领域
本发明涉及鼾声检测及疾病判别领域,具体涉及一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统。
背景技术
睡眠呼吸暂停综合征(OSAHS)是一种睡眠时候呼吸停止的睡眠障碍,表现为在连续7h睡眠中发生30次以上的呼吸暂停,每次气流中止10s以上(含10s),或平均每小时低通气次数(呼吸紊乱指数)超过5次,而引起慢性低氧血症及高碳酸血症的临床综合征。一般可以分为中枢型、阻塞型及混合型。该病症因为反复发作的低血氧、高碳酸血症会出现神经功能失调,儿茶酚胺、内皮素及肾素-血管紧张素系统失调,内分泌功能紊乱及血液动力学改变等情况,更严重甚至会危及生命。因此,对呼吸暂停综合征的及早诊断和治疗是十分关键的。
而对于睡眠呼吸暂停综合征来说,中枢型、阻塞型及混合型呼吸暂停综合征的病因及危害都各不相同。阻塞性睡眠呼吸暂停(obstructive sleep apnea hyperpnoeasyndrome简称OSAHS),即在睡眠中因上气道阻塞引起呼吸暂停,表现为口鼻腔气流停止而胸腹呼吸动作尚存在。是一种累及多系统并造成多器官损害的睡眠呼吸疾病,是高血压、冠心病、心律失常、脑卒中等多种疾病的独立危险因素。中枢性睡眠呼吸暂停(central sleepapnea syndrome简称CSAS),即口鼻腔气流和胸腹呼吸动作同时停止。主要由于中枢神经系统的呼吸中枢功能障碍,或支配呼吸肌的神经、呼吸肌病变,虽然气道可能无堵塞,但呼吸机不能正常工作导致呼吸停止。混合性睡眠呼吸暂停(mixed sleep apnea syndrome简称MSAS),即上述两者并存,以中枢性呼吸暂停开始,继之表现为阻塞性睡眠呼吸暂停。睡眠中潮气量减小,即呼吸气流降低超过正常气流强度的50%以上,伴血氧饱和度下4%以上,称为呼吸不全或低通气。因此为了更好地治疗,需要能够准确地判别出各类的呼吸暂停综合征。
根据调研和研究表明,现阶段对于OSAHS的诊断,绝大多数医院使用的是专用的诊断装置-多导睡眠监测仪(PSG),这是一个穿戴式的复合设备,依靠贴在人身体上的电极,监测佩戴者的脑电、心电、眼电、肌电、胸腹式呼吸运动、鼾声、脉搏、血氧饱和度、脉搏波、呼吸频率、体位等多维数据,综合评定佩戴者的健康状况。虽然该装置的准确可靠,但是有着携带不便、价格高昂、影响睡眠等诸多缺点,使得大部分患者不能得到及时地诊断。而鉴于鼾声的产生与呼吸道的生理结构关系紧密,鼾声极有可能能够反映出患者呼吸道发生病变的一些情况,并且有研究表明各类OSAHS患者的鼾声声存在一定的差异,因此可以根据鼾声快捷判别患者的呼吸暂停综合征病变原因。而EfficientNet是谷歌在2019年提出的一项新型模型,使用一种简单但高效的复合系数(compound coefficient)以更加结构化的方式扩展CNN。与任意扩展网络维度(如宽度、深度、分辨率)的传统方法不同,该新模型使用固定的一组缩放系数扩展每个维度,极大地提升了模型的准确率和效率,对于鼾声分类上可以起到优异的效果。
发明内容
本发明旨在针对现有技术存在的缺点与不足,提供一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统。该系统可以提取被测患者的鼾声事件,并通过高效的神经网络对鼾声事件进行判别分类,从而判断出患者的呼吸暂停综合征种类。具体技术方案如下:
一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块,
所述音频采集模块,用于采集被测患者整晚睡眠状态时音频;
所述鼾声提取模块,用于提取完整音频中所有的鼾声段音频;
所述特征提取模块,用于对采集得到的鼾声段进行特征提取;
所述鼾声识别模块,用于使用基于EfficientNeT神经网络的模型对所有的鼾声段进行各类鼾声的自动识别与检测;
所述统计判断模块,用于对各类鼾声情况的进行统计,并依据AHI指数完成对各类呼吸暂停综合征的分类检测。
进一步的,所述音频采集模块,通过麦克风阵列采集被测患者整晚睡眠状态时音频。
进一步的,所述鼾声提取模块,通过端点检测识别出鼾声段和无声段,提取出鼾声段信号,使用的是低信噪比下基于谱熵的端点检测算法。
进一步的,所述特征提取模块对音频进行预加重、分帧加窗处理,提取梅尔倒谱系数(MFCC);首先利用一阶高通FIR滤波器完成睡眠声信号的预加重,分帧时选择帧长为20ms,帧移为10ms、50%的重叠率;MFCC特征为由人耳对不同频率的声波有不同的听觉敏感度的启发提出来的特征,特征参数提取过程经过预处理,离散傅里叶变换后计算语音信号的功率谱,再通过一组Mel尺度的三角形滤波器组对频谱进行平滑化,最后计算每个滤波器组输出的对数能量:
得到每个滤波器组输出的对数能量s(m)后经离散余弦变换得到MFCC系数C(n),其中Xa(k)表示各帧信号进行快速傅里叶变换得到的频谱并取模平方得到语音信号的功率谱;H(k)表示能量谱通过三角滤波器得到的频率响应:
进一步的,所述鼾声识别模块,选用tensorflow框架运行谷歌的EfficientNeT神经网络,根据数据对网络进行微调,使用Swish激活函数,其公式如下:
f(x)=x·sigmoid(βx)
β是个常数或可训练的参数。
使用保存好的模型对正常鼾声、阻塞暂停鼾声、中枢暂停鼾声、混合暂停鼾声的四分类,对呼吸暂停低通气综合征各类鼾声的自动识别与检测;具体包括:训练数据为四类,分别是经过PSG确认的非呼吸暂停相关鼾声、阻塞型呼吸暂停相关鼾声、中枢型呼吸暂停相关鼾声以及混合型呼吸暂停相关鼾声,将这四类数据输入到神经网络进行识别捕捉相关特征之间的联系和区别,得到最终训练模型,完成对各类鼾声的自动识别。
进一步的,所述统计判断模块,将被测患者的所有鼾声段音频提取出的MFCC作为网络输入,得出各类鼾声统计,并根据AHI指数判别被测患者的呼吸暂停综合征具体情况。
本发明相对于现有技术具有如下的优点和效果:
1.本发明方法及系统有着价格低廉,易于携带且不影响被测患者睡眠等优势,可以适配绝大部分呼吸暂停综合征患者。
2.本发明方法及系统根据呼吸暂停综合征种类划分鼾声类型:正常鼾声、阻塞型呼吸暂停鼾声、中枢型呼吸暂停鼾声、混合型呼吸暂停鼾声,研究四类鼾声的特征差异,较精确的实现了四类鼾声的自动分类,并综合各类鼾声情况以及AHI指数,可以较为准确地实现被测患者的呼吸暂停综合征情况,便于医生对症治疗。
附图说明
图1为本申请实施例提供的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统的检测流程示意图。
图2为申请实施例提供的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统的系统框图。
具体实施方式
为了使本发明的目的、技术方案以及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不限于本发明。
如图1所示,本发明的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块。
所述音频采集模块,用于采集被测患者整晚睡眠状态时音频。具体为通过麦克风阵列采集被测患者整晚睡眠状态时音频,麦克风按照指定要求排列,使用改进的自适应波束形成算法,实现采集音频的去混响,语音增强。患者只需将设备放置在床边,系统就会自动采集音频信号并将数据上传至服务器端。
所述鼾声提取模块,用于提取完整音频中所有的鼾声段音频。具体为通过端点检测技术识别出鼾声段和无声段,提取出鼾声段信号,使用的是低信噪比下基于谱熵的端点检测算法,可以精确判断出鼾声段信号,并通过算法脚本自动截取出鼾声段信号。谱熵的算法如下:对快速傅立叶变换(FFT)进行充分利用,从而得到每一帧信号的频谱[Sn=|x(n)|2],在此各个频谱谱向量的系数代表了此帧信号在该频率点的大小分布情况。其次对每一帧的每个频谱分量在每帧的总能量中所占比例进行运算,其计算结果认为是信号能量集中在某频率点的概率。即通过下式的概率密度函数计算熵:
s(fi)为信号是是s(n)经过FFT变换后的频谱分量,N表示FFT变化长度,pi表示相应的概率函数,i为FFT变换的频率索引。
所述特征提取模块,用于对采集得到的鼾声段进行特征提取。具体为对音频进行预加重、分帧加窗处理,提取梅尔倒谱系数(MFCC)。首先利用一阶高通FIR滤波器完成睡眠声信号的预加重,分帧时选择帧长为20ms,帧移为10ms、50%的重叠率;MFCC特征为由人耳对不同频率的声波有不同的听觉敏感度的启发提出来的特征,特征参数提取过程经过预处理,离散傅里叶变换后计算语音信号的功率谱,再通过一组Mel尺度的三角形滤波器组对频谱进行平滑化,从而避免特征参数受到语音的音调高低的影响,最后计算每个滤波器组输出的对数能量:
得到每个滤波器组输出的对数能量s(m)后经离散余弦变换得到MFCC系数C(n),其中Xa(k)表示各帧信号进行快速傅里叶变换得到的频谱并取模平方得到语音信号的功率谱;H(k)表示能量谱通过三角滤波器得到的频率响应:
所述鼾声识别模块,用于使用EfficientNeT神经网络及设置训练参数、方案,具体包括:选用tensorflow框架运行谷歌的EfficientNeT神经网络,根据数据对网络进行微调,使用Swish激活函数,其公式如下:
f(x)=x·sigmoid(βx)
β是个常数或可训练的参数。Swish具备无上界有下界、平滑、非单调的特性。Swish在深层模型上的效果优于常用的ReLU。例如,仅仅使用Swish单元替换ReLU就能把MobileNASNetA在ImageNet上的top-1分类准确率提高0.9%,Inception-ResNet-v的分类准确率提高0.6%。选择softmax函数作为输出预测结果概率函数,使用categorical_crossentropy作为多分类损失函数,优化器选择为Adam,衡量指标为精确度(acc),使用学习率动态调整方案,以及使用5折交叉验证增强稳定性;网络训练参数包括:初始学习率lr=0.0001、dropout=0.5、train-epoch=100,batch-size=128。
使用保存好的模型对正常鼾声、阻塞暂停鼾声、中枢暂停鼾声、混合暂停鼾声的四分类,对呼吸暂停低通气综合征各类鼾声的自动识别与检测;具体包括:训练数据为四类,分别是经过PSG确认的非呼吸暂停相关鼾声、阻塞型呼吸暂停相关鼾声、中枢型呼吸暂停相关鼾声以及混合型呼吸暂停相关鼾声,将这四类数据输入到神经网络进行识别捕捉相关特征之间的联系和区别,得到最终训练模型,完成对各类鼾声的自动识别。
所述统计判断模块,用于对各类鼾声情况的进行统计,并依据AHI指数完成对各类呼吸暂停综合征的分类检测。具体包括:将被测患者的所有鼾声段音频提取出的MFCC作为网络输入,得出各类鼾声统计,并根据AHI指数判别被测患者的呼吸暂停综合征具体情况。
本系统使用的训练数据是采集的经过PSG设备和资深医生诊断过的各类呼吸暂停患者的睡眠鼾声数据,将PSG测得的各类呼吸暂停时间段提取出特征最明显的呼吸暂停段后鼾声,经过标注后作为四分类网络的输入进行训练:
确定训练样本集D={(X1,y1),(X2,y2),...,(Xn,yn)},yi∈{1,2,3,4},X表示由呼吸暂停段后鼾声提取的MFCC特征组成的特征矩阵,y表示各类呼吸暂停事件标签,分别取值为0(正常鼾声)、1(阻塞鼾声)、2(中枢鼾声)和4(混合鼾声),n表示训练样本数;
采用EfficientNet神经网络对提取得到的特征数据进行训练,建立特征之间的区别和联系的模型,经过数据检测,该模型对各类呼吸暂停综合征患者都有着良好的识别率;
本系统提供了数据传输接口和云端服务器,用于数据传输以及处理,同时,本系统的结果支持显示于pc端与手机端,可以快捷地查看被测患者的鼾声分析情况。
Claims (6)
1.一种基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,包括音频采集模块、鼾声提取模块、特征提取模块、鼾声识别模块、统计判断模块,其特征在于:
所述音频采集模块,用于采集被测患者整晚睡眠状态时音频;
所述鼾声提取模块,用于提取完整音频中所有的鼾声段音频;
所述特征提取模块,用于对采集得到的鼾声段进行特征提取;
所述鼾声识别模块,用于使用基于EfficientNeT神经网络的模型对所有的鼾声段进行各类鼾声的自动识别与检测;
所述统计判断模块,用于对各类鼾声情况的进行统计,并依据AHI指数完成对各类呼吸暂停综合征的分类检测。
2.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,其特征在于:所述音频采集模块,通过麦克风阵列采集被测患者整晚睡眠状态时音频。
3.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,其特征在于:所述鼾声提取模块,通过端点检测识别出鼾声段和无声段,提取出鼾声段信号,使用的是低信噪比下基于谱熵的端点检测算法。
4.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,其特征在于:所述特征提取模块对音频进行预加重、分帧加窗处理,提取梅尔倒谱系数(MFCC);首先利用一阶高通FIR滤波器完成睡眠声信号的预加重,分帧时选择帧长为20ms,帧移为10ms、50%的重叠率;MFCC特征为由人耳对不同频率的声波有不同的听觉敏感度的启发提出来的特征,特征参数提取过程经过预处理,离散傅里叶变换后计算语音信号的功率谱,再通过一组Mel尺度的三角形滤波器组对频谱进行平滑化,最后计算每个滤波器组输出的对数能量:
得到每个滤波器组输出的对数能量s(m)后经离散余弦变换得到MFCC系数C(n),其中Xa(k)表示各帧信号进行快速傅里叶变换得到的频谱并取模平方得到语音信号的功率谱;H(k)表示能量谱通过三角滤波器得到的频率响应:
5.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,其特征在于:所述鼾声识别模块,选用tensorflow框架运行谷歌的EfficientNeT神经网络,根据数据对网络进行微调,使用Swish激活函数,其公式如下:
f(x)=x·sigmoid(βx)
β是个常数或可训练的参数。
使用保存好的模型对正常鼾声、阻塞暂停鼾声、中枢暂停鼾声、混合暂停鼾声的四分类,对呼吸暂停低通气综合征各类鼾声的自动识别与检测;具体包括:训练数据为四类,分别是经过PSG确认的非呼吸暂停相关鼾声、阻塞型呼吸暂停相关鼾声、中枢型呼吸暂停相关鼾声以及混合型呼吸暂停相关鼾声,将这四类数据输入到神经网络进行识别捕捉相关特征之间的联系和区别,得到最终训练模型,完成对各类鼾声的自动识别。
6.如权利要求1所述的基于EfficientNeT神经网络的各类呼吸暂停综合征的分类检测系统,其特征在于:
所述统计判断模块,将被测患者的所有鼾声段音频提取出的MFCC作为网络输入,得出各类鼾声统计,并根据AHI指数判别被测患者的呼吸暂停综合征具体情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010643345.4A CN111613210A (zh) | 2020-07-06 | 2020-07-06 | 一种各类呼吸暂停综合征的分类检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010643345.4A CN111613210A (zh) | 2020-07-06 | 2020-07-06 | 一种各类呼吸暂停综合征的分类检测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111613210A true CN111613210A (zh) | 2020-09-01 |
Family
ID=72197103
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010643345.4A Pending CN111613210A (zh) | 2020-07-06 | 2020-07-06 | 一种各类呼吸暂停综合征的分类检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111613210A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580751A (zh) * | 2020-12-31 | 2021-03-30 | 杭州电子科技大学 | 一种基于zynq与深度学习的鼾声辨识装置 |
CN112735480A (zh) * | 2021-01-25 | 2021-04-30 | 杭州电子科技大学 | 一种基于神经网络的声带病变检测装置 |
WO2023066135A1 (zh) * | 2021-10-19 | 2023-04-27 | 麒盛科技股份有限公司 | 一种基于移动设备检测睡眠呼吸暂停的方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010066008A1 (en) * | 2008-12-10 | 2010-06-17 | The University Of Queensland | Multi-parametric analysis of snore sounds for the community screening of sleep apnea with non-gaussianity index |
US20150342519A1 (en) * | 2014-05-28 | 2015-12-03 | Huneo, LLC | System and method for diagnosing medical condition |
CN106821337A (zh) * | 2017-04-13 | 2017-06-13 | 南京理工大学 | 一种有监督的鼾声来源识别方法 |
CN108670200A (zh) * | 2018-05-30 | 2018-10-19 | 华南理工大学 | 一种基于深度学习的睡眠鼾声分类检测方法及系统 |
CN110491416A (zh) * | 2019-07-26 | 2019-11-22 | 广东工业大学 | 一种基于lstm和sae的电话语音情感分析与识别方法 |
CN110852449A (zh) * | 2019-11-25 | 2020-02-28 | 北京百度网讯科技有限公司 | 模型迁移方法和电子设备 |
CN110942784A (zh) * | 2019-11-21 | 2020-03-31 | 杭州电子科技大学 | 基于支持向量机的鼾声分类系统 |
CN111312293A (zh) * | 2020-02-17 | 2020-06-19 | 杭州电子科技大学 | 一种基于深度学习对呼吸暂停症患者的识别方法及系统 |
-
2020
- 2020-07-06 CN CN202010643345.4A patent/CN111613210A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010066008A1 (en) * | 2008-12-10 | 2010-06-17 | The University Of Queensland | Multi-parametric analysis of snore sounds for the community screening of sleep apnea with non-gaussianity index |
US20150342519A1 (en) * | 2014-05-28 | 2015-12-03 | Huneo, LLC | System and method for diagnosing medical condition |
CN106821337A (zh) * | 2017-04-13 | 2017-06-13 | 南京理工大学 | 一种有监督的鼾声来源识别方法 |
CN108670200A (zh) * | 2018-05-30 | 2018-10-19 | 华南理工大学 | 一种基于深度学习的睡眠鼾声分类检测方法及系统 |
CN110491416A (zh) * | 2019-07-26 | 2019-11-22 | 广东工业大学 | 一种基于lstm和sae的电话语音情感分析与识别方法 |
CN110942784A (zh) * | 2019-11-21 | 2020-03-31 | 杭州电子科技大学 | 基于支持向量机的鼾声分类系统 |
CN110852449A (zh) * | 2019-11-25 | 2020-02-28 | 北京百度网讯科技有限公司 | 模型迁移方法和电子设备 |
CN111312293A (zh) * | 2020-02-17 | 2020-06-19 | 杭州电子科技大学 | 一种基于深度学习对呼吸暂停症患者的识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
侯丽敏等: "鼾声的基频分布与SAHS的关联性", 《声学技术》 * |
贠照强: "口腔种植规划中CBCT影像处理与智能分析方法研究", 《中国博士学位论文全文数据库》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580751A (zh) * | 2020-12-31 | 2021-03-30 | 杭州电子科技大学 | 一种基于zynq与深度学习的鼾声辨识装置 |
CN112735480A (zh) * | 2021-01-25 | 2021-04-30 | 杭州电子科技大学 | 一种基于神经网络的声带病变检测装置 |
WO2023066135A1 (zh) * | 2021-10-19 | 2023-04-27 | 麒盛科技股份有限公司 | 一种基于移动设备检测睡眠呼吸暂停的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108670200B (zh) | 一种基于深度学习的睡眠鼾声分类检测方法及系统 | |
CN111613210A (zh) | 一种各类呼吸暂停综合征的分类检测系统 | |
CN110570880B (zh) | 一种鼾声信号识别方法 | |
US10007480B2 (en) | Multi-parametric analysis of snore sounds for the community screening of sleep apnea with non-Gaussianity index | |
CN111696575B (zh) | 基于混合神经网络模型的低通气和呼吸暂停检测识别系统 | |
US20220225930A1 (en) | Apnea monitoring method and apparatus | |
CN102973277B (zh) | 一种频率跟随响应信号测试系统 | |
CN110970042B (zh) | 一种电子听诊器的肺部啰音人工智能实时分类方法、系统、装置及可读存储介质 | |
US20200093423A1 (en) | Estimation of sleep quality parameters from whole night audio analysis | |
CN111685774B (zh) | 基于概率集成回归模型的osahs诊断方法 | |
JP7197922B2 (ja) | 機械学習装置、解析装置、機械学習方法および解析方法 | |
CN108305680B (zh) | 基于多元生物学特征的智能帕金森症辅助诊断方法和装置 | |
CN105448291A (zh) | 基于语音的帕金森症检测方法及检测系统 | |
CN110942784A (zh) | 基于支持向量机的鼾声分类系统 | |
Dafna et al. | Sleep-quality assessment from full night audio recordings of sleep apnea patients | |
CN115346561B (zh) | 基于语音特征的抑郁情绪评估预测方法及系统 | |
WO2017135127A1 (ja) | 生体音響抽出装置、生体音響解析装置、生体音響抽出プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 | |
CN113288065A (zh) | 一种基于鼾声的实时呼吸暂停及低通气预测方法 | |
CN105962897A (zh) | 一种自适应的鼾声信号检测方法 | |
CN112820319A (zh) | 一种人类鼾声识别方法及其装置 | |
CN113974607B (zh) | 一种基于脉冲神经网络的睡眠鼾声检测系统 | |
CN111312293A (zh) | 一种基于深度学习对呼吸暂停症患者的识别方法及系统 | |
Jiang et al. | An OSAHS evaluation method based on multi-features acoustic analysis of snoring sounds | |
Porieva et al. | Investigation of lung sounds features for detection of bronchitis and COPD using machine learning methods | |
Sofwan et al. | Normal and Murmur Heart Sound Classification Using Linear Predictive Coding and k-Nearest Neighbor Methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200901 |