CN110634504B - 一种鼾声检测方法和装置 - Google Patents
一种鼾声检测方法和装置 Download PDFInfo
- Publication number
- CN110634504B CN110634504B CN201910871659.7A CN201910871659A CN110634504B CN 110634504 B CN110634504 B CN 110634504B CN 201910871659 A CN201910871659 A CN 201910871659A CN 110634504 B CN110634504 B CN 110634504B
- Authority
- CN
- China
- Prior art keywords
- snore
- formant
- condition
- audio signal
- max
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010041235 Snoring Diseases 0.000 title claims abstract description 225
- 238000001514 detection method Methods 0.000 title claims abstract description 34
- 230000005236 sound signal Effects 0.000 claims abstract description 107
- 238000000034 method Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000009432 framing Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 206010011224 Cough Diseases 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 206010021143 Hypoxia Diseases 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000007954 hypoxia Effects 0.000 description 2
- 206010003497 Asphyxia Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000008784 apnea Diseases 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001146 hypoxic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 201000002859 sleep apnea Diseases 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
本发明公开了一种鼾声检测方法和装置,所述方法利用音频信号的过零率和共振峰特性,识别鼾声信号;在利用共振峰特性识别鼾声信号时,判断是否满足两个条件;条件L1为:判断最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1是否在设定范围内;条件L2为:当音频信号存在频率低于频率阈值θ的共振峰Pd时,判断最高峰共振峰与共振峰Pd的峰值之比Q2是否对应范围内;如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。本发明能够提高鼾声检测的准确度,降低检测的复杂度。
Description
技术领域
本发明涉及声音检测领域,具体而言涉及一种鼾声检测方法和装置。
背景技术
打鼾是一种十分普遍的现象,大约有20%~40%的人群患有打鼾症状。打鼾不仅困扰患者、影响同伴,严重时还会对患者的健康造成威胁,影响人们的正常生活。打鼾严重者,会患有睡眠呼吸暂停综合征,在睡眠过程中出现呼吸暂停的现象,导致血液中氧气含量减少,形成一个短时间的缺氧状态。当患者长期处于缺氧状态时,可能会诱发一些慢性疾病:高血压、心肌梗死等,如果缺氧时间超过120秒可能会导致窒息死亡。
目前市场上常见的止鼾产品采用鼾声阈值判断的方法,检测声音的分贝值,当大于阈值时则认为是鼾声,此种方法只适合于安静的环境下,不能区分说话人声音、咳嗽声等声音。还有通过检测声音的周期性来判断是否是鼾声,这种方法成本低,但是抗干扰能力差,难以区分语音以及其它频率相近的声音。
医学上使用多导睡眠仪或是采用整晚声音采集结合功率谱分析方法。前者要求专业人员进行操作,后者虽然准确率高,但是需要的硬件成本高,算法复杂,不能实时检测。两者皆不适合用于民用产品。
因此,设计一种简便、准确率高的鼾声检测方法变得十分重要。
发明内容
有鉴于此,本发明提供了一种鼾声检测方法和装置,提高鼾声检测的准确度,降低检测的复杂度。
为了解决上述技术问题,本发明是这样实现的:
一种鼾声检测方法,利用音频采集设备采集音频信号,检测识别设备对音频信号进行鼾声检测;所述检测识别设备利用音频信号的过零率和共振峰特性,识别鼾声信号;
在利用共振峰特性识别鼾声信号时,判断是否满足条件L1和条件L2;
所述条件L1为:获取最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1,当Q1在鼾声对应的第一比值范围内,则认为满足条件L1;
所述条件L2为:当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2,当Q2在鼾声对应的第二比值范围内,则认为满足条件L2;
如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。
优选地,利用过零率筛选鼾声信号为:对音频信号进行加窗分帧处理,求每帧信号的过零率,将设定的判断周期内所有帧信号过零率均值作为音频信号过零率;如果音频信号过零率在所设过零率阈值范围内,则判定当前音频信号满足鼾声的过零率特征。
优选地,利用共振峰特性识别鼾声信号为:
步骤1、从音频信号获取各个共振峰的峰值、频率及带宽;
步骤2、判断音频信号中是否存在频率低于频率阈值θ的共振峰Pd,如果存在,则执行步骤3;否则,执行步骤5;
步骤3、获取最高共振峰与共振峰Pd的峰值之比Q2;
步骤4、判断比值Q2是否大于在鼾声对应的第二比值范围内;如果是,判定满足条件L2,执行步骤5;否则,确定当前音频信号不是鼾声;
步骤5、获取音频信号最高共振峰的共振峰频率fmax与带宽Wmax的比值Q1;
步骤6、判断比值Q1是否在鼾声对应的第一比值范围内;如果是,则满足条件L1,确定当前音频信号满足鼾声的共振峰特性;否则,确定当前音频信号不是鼾声。
优选地,所述利用音频采集设备采集音频信号时,采用8k的采样率;检测识别设备每5秒进行一次鼾声检测判断。
优选地,所述条件L1中,鼾声对应的第一比值范围为与最高共振峰的峰值频率fmax有关,通过试验确定不同峰值频率fmax对应的第一比值范围。
优选地,所述条件L1中,鼾声对应的第一比值范围为与最高共振峰的峰值频率fmax有关,且Q1=fmax/Wmax,则:
当500Hz≤fmax≤1000Hz时,第一比值范围取(3,∞);
当1000Hz<fmax≤2000Hz时,第一比值范围取(6,∞);
当2000Hz<fmax≤3000Hz时,第一比值范围取(10,40);
当fmax>3000Hz时,Q2=Amax/Ad,Amax为所述最高共振峰的峰值,Ad为所述共振峰Pd的峰值,则第一比值范围取(16.5,∞)。
所述条件L2中,第二比值范围为[10,∞);
所述频率阈值θ=500Hz;
在利用过零率识别鼾声时,过零率阈值范围为[40,110],过零率在过零率阈值范围内被判定为疑似鼾声。
本发明还公开了一种鼾声检测装置,该装置包括信号采集设备和检测识别设备;检测识别设备包括过零率判断模块、共振峰判断模块和确定模块;
所述信号采集设备,用于采集音频信号并转化为数字信号,发送给所述检测识别设备;
所述过零率判断模块,用于提取音频信号的过零率,判断是否满足鼾声的过零率特征;
所述共振峰判断模块,用于提取音频信号的共振峰特性,判断共振峰特性是否满足条件L1和条件L2;所述条件L1为:获取最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1,当Q1在鼾声对应的第一比值范围内,则认为满足条件L1;所述条件L2为:当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2,当Q2在鼾声对应的第二比值范围内,则认为满足条件L2;如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性;
所述确定模块,用于在音频信号同时满足鼾声的过零率特征和共振峰特性时,判定检测到鼾声。
优选地,所述过零率判断模块对音频信号进行加窗分帧处理,求每帧信号的过零率,将设定的判断周期内所有帧信号过零率均值作为音频信号过零率;如果音频信号过零率在所设过零率阈值范围内,则判定音频信号满足鼾声的过零率特征;所述过零率阈值范围为[40,110]。
优选地,所述共振峰判断模块包括特征值提取子模块、L2条件判断子模块、L1条件判断子模块和综合判断子模块;
特征值提取子模块,用于从音频信号获取各个共振峰的峰值、频率及带宽;
L2条件判断子模块,用于当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2;判断比值Q2是否在鼾声对应的第二比值范围内,如果是则判定满足条件L2;将判定结果告知综合判断子模块;
L1条件判断子模块,用于获取音频信号最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1;判断比值Q1是否在鼾声对应的第一比值范围内;如果是,则判定满足条件L1;将判定结果告知综合判断子模块;
综合判断子模块,用于接收来自L2条件判断子模块和L1条件判断子模块的判断结果;如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。
优选地,L2条件判断子模块在判定满足条件L2或者在检测到不存在共振峰Pd时,通知L1条件判断子模块进行处理;L1条件判断子模块在收到通知后,进行L1条件是否满足的判断;
所述综合判断子模块先考虑L2条件判断子模块的判定结果,如果判定结果显示不满足条件L2,则直接判定当前语音信号不满足鼾声的共振峰特性;如果判定结果显示满足条件L2或者不存在共振峰Pd,则进一步考虑L1条件判断子模块的判定结果,如果此时条件L1的判定结果显示满足条件L1,则确定当前音频信号满足鼾声的共振峰特性。
优选地,所述条件L1中,鼾声对应的第一比值范围为与最高共振峰的峰值频率fmax有关;所述共振峰判断模块预存有各种fmax对应的第一比值范围;根据当前语音信号的fmax,提取对应的第一比值范围进行条件L1的判断。
有益效果:
(1)本发明通过获取所采集音频信号的过零率与共振峰特性,并设置相应阈值来实现鼾声的检测,由于鼾声的过零率与共振峰特性与普通语音、咳嗽、敲击、拍手等所造成的声音有很明显的差异,通过判断比较过零率与共振峰特性可以更加精确的确定采集到的音频信号是否是鼾声,提高了鼾声检测的准确率。
(2)在利用共振峰特性识别鼾声信号时,本发明设计了两个比较参数,其中,最大共振峰频率与带宽比值Q1用于有针对性的从背景音中筛选出鼾声(条件L1),最大共振峰与低于θ共振峰值的幅度比值Q2用于排除与鼾声相似的语音(条件L2),这两个参数的设计能够提高鼾声检测的准确率。
而且,这两个比较参数均是比值,计算简单,从而降低了鼾声检测的难度。
(3)在利用共振峰特性识别鼾声信号时,在一实施例中,先判断音频信号中是否存在频率低于频率阈值θ的共振峰Pd,如果存在,则利用鼾声信号共振峰最高峰和共振峰的峰值比较大的特点,将语音、咳嗽等声音排除;由于环境中,其他声音占较大比例,因此先排除语音的方式,可以尽快获得检测结果,而不用进行更多的判定,从而提高了识别速度。
(4)在针对条件L1设定比值Q1的范围时,在研究中发现该比值范围与共振峰最高峰对应的峰值频率fmax有关,因此试验确定出不同峰值频率fmax对应的比值范围。在使用时,根据fmax选择合适的比值范围作为判断准则,从而能够有效提高鼾声检测的准确率。
(5)在一实施例中,根据鼾声的周期,与鼾声集中频率区域,采用8k的采样率,并且每5秒进行一次鼾声检测判断;在此条件下,给出了鼾声所对应的Q1范围、Q2对应的阈值T以及频率阈值θ的值,采用给定的这些值,可以非常准确的识别出鼾声。
附图说明
图1为本发明鼾声检测方法的流程示意图;
图2为图1中步骤5共振峰特性判断的流程示意图;
图3为鼾声过零率示意图;(a)为鼾声波形,(b)为对应的过零率波形;
图4为鼾声共振峰特性曲线;(a)为鼾声波形,(b)为对应的功率谱曲线;
图5为非鼾声共振峰特性曲线;(a)为非鼾声波形,(b)为对应的功率谱曲线;
图6为本发明鼾声检测装置的组成示意图;
图7为图6中共振峰判断模块的组成示意图。
具体实施方式
本发明提供了一种鼾声检测方案,其基本思想是:利用音频信号的过零率和共振峰特性识别鼾声信号。其中,在利用过零率识别鼾声信号时,根据过零率是否在设定范围内来识别。在利用共振峰特性识别鼾声信号时,考虑两个方面的内容:
一方面是,本申请人发现,鼾声与说话语音、咳嗽等声音的共振峰范围不同。说话语音、咳嗽等声音的共振峰特性中,能量相对集中在某个频率以下,通过试验测定该频率阈值为500Hz,即低于500Hz的共振峰频率对应的峰值很高;而在鼾声的共振峰特性中,能量相对集中在500Hz以上。因此可以将500Hz作为中间界限。但是有些鼾声可能也落入了共振峰低于500Hz的范围,但是本申请人发现,即使存在低于500Hz的共振峰频率,与之对应的峰值也很低,至少是低于说话语音、咳嗽等声音的共振峰峰值。因此可以采用共振峰最高峰与各共振峰的峰值比作为一个识别条件。也就是说,当存在频率低于500Hz的共振峰时,利用共振峰最高峰与该共振峰的峰值比来区分鼾声和一般说话声、咳嗽等语音;根据鼾声的这一特性,可以更加精确的排除语音的干扰;
另一方面,本申请人研究发现,鼾声共振峰特性中峰值最高点对应的共振峰频率的带宽在200Hz以内,而其他一些与鼾声共振峰频率相近的声音信号的带宽都大于200Hz,大都集中在300Hz左右,根据鼾声的这一特性,可以实现更加精确的鼾声检测。因此,本发明将峰值最高点对应的共振峰频率与带宽的比值作为一个区别特征,将鼾声从音频信号中识别出来。
基于上述分析,下面结合附图并举实施例,对本发明进行详细描述。
本实施例中,先进行过零率识别,再进行共振峰特性判断,因为过零率算法更简单,可以在代价更小的情况下排除不可能为鼾声的音频信号。在实际中,可以先进行共振峰特性的识别,或者过零率和共振峰特性并行识别,过零率和共振峰特性均符合,才认定为鼾声。但是并行识别的效率没有串行识别效率高,因为两个特征都要处理一遍。
图1为本发明鼾声检测方法的流程图。如图1所示,该方法包括如下步骤:
步骤1、采集音频信号:
利用音频采集设备采集音频信号。由于鼾声信号的能量大多分布在4kHz以内,且鼾声信号具有准周期性的特点,因此本发明的音频采集设备在获取音频信号时采用2倍于鼾声能量分布区域的采样率,即采用8k的采样率,在实际中可以采用2~3倍于鼾声频率作为采样率;且根据鼾声周期,每5秒进行一次鼾声检测判断。
音频采集设备利用麦克风采集得到原始音频信号之后,得到的是模拟的音频信号,需要将模拟信号转换为数字信号,后续步骤所处理的音频信号是指此处所得的数字信号。
以下步骤2~3为利用过零率筛选鼾声信号。
步骤2、计算所采集音频信号的过零率。
过零率(也称短时平均过零率)是指一帧语音中语音信号波形穿过横轴的次数。
本步骤具体实现为:对音频信号进行加窗分帧处理。在这一过程中,优选帧长为200ms,帧移为80ms,优选汉宁窗;假设在一个判断周期内采集所得音频数字信号为x(n)(也可以是想要进行鼾声判定的任意一段语音信号),则分帧后每一帧内音频信号采用yi(n)表达,其中i表示第i帧。获取yi(n)内语音信号波形穿过横轴的次数,即该帧的过零率。图3为短时鼾声波形及其过零率波形示意图。图3(a)为鼾声波形,图3(b)为对应的过零率波形。
本发明实施例采用式(1)所示计算一帧音频信号的过零率。
yi(n)yi(n+1)<0 (1)
上式(1)表达的意思是,相邻两数据点一正一负,则二者之间连线肯定过零,过零率+1。
假设在设定的判断周期内(本实施例设为5s),信号x(n)分帧后帧数为fn,各帧的过零率为gk,其中,k=1,2,3...fn。则一段音频信号的过零率为音频信号各帧信号的过零率的均值G,可表示为:
步骤3、判断音频信号的过零率G是否在设定的过零率阈值范围内,如果是,则判定音频信号满足鼾声的过零率特征,需要进一步判定共振峰特性,转入步骤4;否则,判定当前音频信号为非鼾声信号,而是一些其他声音,如说话语音、敲击等噪音。
在本实施例中,鼾声的过零率阈值范围为40~110。本申请人研究发现,鼾声的过零率基本在40~80之间,对于一些打鼾时呼气时间较长的患者,过零率会高于80。而说话语音、物体碰撞、敲击等造成的噪声,它们的过零率都相对较小,大都集中在30以内。
对于那些与鼾声过零率相近的声音,可通过以下步骤4~5的共振峰特性判断进行区分。
步骤4、获取音频信号的共振峰特性。
针对步骤1所得的音频数字信号,将其转化为功率谱,从功率谱中提取各共振峰的峰值、频率和带宽。可以采用线性预测系数法(LPC)实现音频信号到功率谱的转化。
优选地,在提取共振峰之前,可以进一步对输入音频数字信号进行预加重,这里预加重是采用一阶的高通滤波器对音频信号进行滤波,起到对音频信号高频提升的作用。为了更加精确的计算出共振峰频率和它的带宽,本鼾声检测方法的实施例采用线性预测系数法所提供的抛物线内插的方法计算共振峰频率和它的带宽。
步骤5、判断音频信号的共振峰特性是否鼾声的共振峰特性,如果是,则判定为音频信号为鼾声;否则,判定音频信号不是鼾声。
图2为本步骤5进行共振峰特性判断的具体实现过程,在判断过程中,涉及到的两个条件为:
条件L1:获取最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1,当Q1在鼾声对应的第一比值范围内,则认为满足条件L1;
条件L2:当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2,当Q2在鼾声对应的第二比值范围内,则认为满足条件L2;如果不存在共振峰Pd,则不考虑本条件L2。
如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。
参见图2,上述共振峰特性的判断过程包括如下步骤:
步骤501、判断音频信号的共振峰中是否存在低于频率阈值θ=500Hz的共振峰,若存在,则将该共振峰记为Pd,执行步骤502;否则,执行步骤504。
本实施例中选择频率阈值θ=500Hz。该频率阈值500Hz适合大多数的打鼾者。优选地,可以针对不同使用者确定更加适用的频率阈值,这样鼾声的判断效果更佳。
步骤502、获取最高共振峰的峰值Amax与共振峰Pd的峰值Ad,计算Amax与Ad的比值Q2。本发明并不限定该比值Q2是Amax/Ad还是Ad/Amax,只要测定不同的阈值范围即可。
步骤503、判断比值Q2是否处于鼾声对应的第二比值范围内;该第二比值范围是预先通过试验数据分析确认的鼾声和非鼾声之间的阈值。如果是,则判定满足条件L2,说明当前音频有别于说话语音、咳嗽等声音,极有可能是鼾声,此时执行步骤504,继续进行判断;否则,确定当前音频信号不是鼾声。
本发明优选实施例中,令Q2=Amax/Ad,对于鼾声来说,由于Ad较低,Q2将会较高,那么可以设定一个下限T,因此第二比值范围是[T,∞)。当Q2大于T时,可以判定符合鼾声共振峰特征。其中,T可以预先通过试验确定,优选地取T=10,那么第二比值范围就是[10,∞)。参见图4和图5,图4中的(a)为鼾声波形,(b)为对应的功率谱曲线。从图4(b)中可以看出,当鼾声功率谱中存在低于500Hz共振峰时,其共振峰幅值非常小,即Ad较低。而图5(b)中示出的非鼾声功率谱中存在低于500Hz共振峰的幅值很高。
在实际中,也可以采用Q2=Ad/Amax作为参考值。对于鼾声来说,由于Ad较低,Q2将会较小,那么Q2小于阈值T’才可能是鼾声,因此判断条件是Q2小于T’,也就是第二比值范围是(0,T']。T’可以通过预先进行试验获得。
步骤504、获取音频信号最高共振峰Pmax处的共振峰频率fmax和带宽Wmax,计算fmax与Wmax的比值Q1。本发明并不限定该比值Q1是fmax/Wmax还是Wmax/fmax,只要测定不同的阈值范围即可。
步骤505、判断比值Q1是否在鼾声对应的第一比值范围内;如果是,则当前音频信号满足鼾声共振峰特性,由于在本实施例中前面已经进行了过零率的判断,因此这里可以确定出当前音频信号为鼾声信号;如不满足所设第一比值范围,则确定当前音频信号为非鼾声信号。
在研究中发现,上述第一比值范围与共振峰最高峰对应的峰值频率fmax有关,因此试验确定出不同峰值频率fmax对应的第一比值范围。在使用时,根据fmax选择合适的比值范围作为判断准则,从而能够有效提高鼾声检测的准确率。
本优选实施例中,令Q1=fmax/Wmax,共振峰频率与带宽的比值是品质因子,可表明声带振动衰减的快慢。在采用8k的采样率,并且每5秒进行一次鼾声检测判断的情况下,获得各fmax对应的第一比值范围为:
当500Hz≤fmax≤1000Hz时,第一比值范围取(3,∞);
当1000Hz<fmax≤2000Hz时,第一比值范围取(6,∞);
当2000Hz<fmax≤3000Hz时,第一比值范围取(10,40);
当fmax>3000Hz时,第一比值范围取(16.5,∞)
如果令Q1=Wmax/fmax则需要重新确定各fmax对应的第一比值范围。
至此,本流程结束。
上述本实施例中,步骤501~505利用共振峰特性识别鼾声信号时,先判断条件L2是否成立,也就是先判断音频信号中是否存在频率低于频率阈值θ的共振峰Pd,如果存在,则利用Q2将语音、咳嗽等声音排除。由于环境中,其他声音占较大比例,因此先排除语音的方式,可以尽快获得检测结果,而不用进行更多的判定,从而提高了识别速度。在实际中,也可以先判断条件L1是否成立,再判断L2是否成立,或者二者并行判断。
基于上述方案,本发明还提供了一种鼾声检测装置,如图6所示,其包括信号采集设备和检测识别设备。其中,检测识别设备包括过零率判断模块、共振峰判断模块和确定模块。
信号采集设备,用于采集音频信号并转化为数字信号,发送给所述检测识别设备中的过零率判断模块和共振峰判断模块。
过零率判断模块,用于提取音频信号的过零率,判断是否满足鼾声的过零率特征。本实施例中,过零率判断模块首先对音频信号进行加窗分帧处理,然后求每帧信号的过零率,将设定的判断周期内所有帧信号过零率均值作为音频信号过零率;如果音频信号过零率在所设过零率阈值范围内,则判定音频信号满足鼾声的过零率特征。其中,过零率阈值范围取40~110为优选取值。
共振峰判断模块,用于提取音频信号的共振峰特性,判断共振峰特性是否同时满足条件L1和条件L2。其中,条件L1为:获取最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1,当Q1在鼾声对应的第一比值范围内,则认为满足条件L1;条件L2为:当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2,当Q2在鼾声对应的第二比值范围内,则认为满足条件L2。Q1和Q2的具体形式,以及第一比值范围和第二比值范围的设定参见上文描述。如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。
优选地,如前所述,在条件L1中,鼾声对应的第一比值范围为与最高共振峰的峰值频率fmax有关;本共振峰判断模块预存有各种fmax对应的第一比值范围;根据当前语音信号的fmax,提取对应的第一比值范围进行条件L1的判断。
确定模块,用于在音频信号同时满足鼾声的过零率特征和共振峰特性时,判定检测到鼾声。
在一优选实施例中,先由过零率判断模块进行判断,当其判定音频信号不满足鼾声的过零率特征时,直接判定为非鼾声,不进行共振峰特征判断;只有在判定音频信号满足鼾声过零率特征时,才通知共振峰判断模块执行共振峰特征判断。因为过零率算法更简单,这样做通过过零率排除不可能为鼾声的音频信号后,不再执行后续算法,可以减小计算代价。
参见图7,共振峰判断模块包括特征值提取子模块、L2条件判断子模块、L1条件判断子模块和综合判断子模块。
特征值提取子模块,用于从音频信号获取各个共振峰的峰值、频率及带宽。
L2条件判断子模块,用于判断音频信号中是否存在频率低于频率阈值θ的共振峰Pd;如果存在Pd,则获取最高共振峰Pmax的峰值Amax和共振峰Pd的峰值Ad,计算Amax与Ad的比值Q2;判断比值Q2是否在鼾声对应的第二比值范围内,如果是则判定满足条件L2;如果不在第二比值范围内则判定不满足条件L2。此外,如果就不存在共振峰Pd,则不考虑本条件L2。该L2条件判断子模块将判定结果告知综合判断子模块。
L1条件判断子模块,用于获取音频信号最高共振峰Pmax处的共振峰频率fmax和带宽Wmax,计算fmax与Wmax的比值Q1;判断比值Q1是否在鼾声对应的第一比值范围内;如果是,则判定满足条件L1;否则,不满足条件L1。将判定结果告知综合判断子模块。
综合判断子模块,用于接收来自L2条件判断子模块和L1条件判断子模块的判断结果;如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。
在本发明优选实施方式中,先判断条件L2,再判断L1。那么L2条件判断子模块在判定满足条件L2或者在检测到不存在共振峰Pd后,通知L1条件判断子模块进行处理。L1条件判断子模块也仅在得到L2条件判断子模块的通知后,才执行其L1条件是否满足的判断的操作。同时,综合判断子模块也会先获得L2条件判断子模块的判定结果,如果条件L2不满足,则直接判定当前语音信号不满足鼾声的共振峰特性;如果判定结果显示满足条件L2或者不存在共振峰Pd,则进一步考虑L1条件判断子模块的判定结果,如果此时条件L1的判定结果显示满足条件L1,则确定当前音频信号满足鼾声的共振峰特性;否则,确定不满足鼾声的共振峰特性。将是否符合共振峰特性的判断结果发送给确定模块,确定模块会获得最后的判定结果。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种鼾声检测方法,利用音频采集设备采集音频信号,检测识别设备对音频信号进行鼾声检测;其特征在于,所述检测识别设备利用音频信号的过零率和共振峰特性,识别鼾声信号;当所述音频信号同时满足鼾声的过零率特征和共振峰特性时,判定检测到鼾声;
在利用共振峰特性识别鼾声信号时,判断是否满足条件L1和条件L2;
所述条件L1为:获取最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1,当Q1在鼾声对应的第一比值范围内,则认为满足条件L1;
所述条件L2为:当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2,当Q2在鼾声对应的第二比值范围内,则认为满足条件L2;
如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。
2.如权利要求1所述的方法,其特征在于,利用过零率筛选鼾声信号为:对音频信号进行加窗分帧处理,求每帧信号的过零率,将设定的判断周期内所有帧信号过零率均值作为音频信号过零率;如果音频信号过零率在所设过零率阈值范围内,则判定当前音频信号满足鼾声的过零率特征。
3.如权利要求1所述的方法,其特征在于,当所述音频信号满足过零率特征时,利用共振峰特性识别鼾声信号为:
步骤1、从音频信号获取各个共振峰的峰值、频率及带宽;
步骤2、判断音频信号中是否存在频率低于频率阈值θ的共振峰Pd,如果存在,则执行步骤3;否则,执行步骤5;
步骤3、获取最高共振峰与共振峰Pd的峰值之比Q2;
步骤4、判断比值Q2是否大于在鼾声对应的第二比值范围内;如果是,判定满足条件L2,执行步骤5;否则,确定当前音频信号不是鼾声;
步骤5、获取音频信号最高共振峰的共振峰频率fmax与带宽Wmax的比值Q1;
步骤6、判断比值Q1是否在鼾声对应的第一比值范围内;如果是,则满足条件L1,确定当前音频信号满足鼾声的共振峰特性;否则,确定当前音频信号不是鼾声。
4.如权利要求1所述的方法,其特征在于,所述利用音频采集设备采集音频信号时,采用8k的采样率;检测识别设备每5秒进行一次鼾声检测判断。
5.如权利要求1所述的方法,其特征在于,所述条件L1中,鼾声对应的第一比值范围为与最高共振峰的峰值频率fmax有关,通过试验确定不同峰值频率fmax对应的第一比值范围。
6.如权利要求4所述的方法,其特征在于,所述条件L1中,鼾声对应的第一比值范围为与最高共振峰的峰值频率fmax有关,且Q1=fmax/Wmax,则:
当500Hz≤fmax≤1000Hz时,第一比值范围取(3,∞);
当1000Hz<fmax≤2000Hz时,第一比值范围取(6,∞);
当2000Hz<fmax≤3000Hz时,第一比值范围取(10,40);
当fmax>3000Hz时,Q2=Amax/Ad,Amax为所述最高共振峰的峰值,Ad为所述共振峰Pd的峰值,则第一比值范围取(16.5,∞);
所述条件L2中,第二比值范围为[10,∞);
所述频率阈值θ=500Hz;
在利用过零率识别鼾声时,过零率阈值范围为[40,110],过零率在过零率阈值范围内被判定为疑似鼾声。
7.一种鼾声检测装置,其特征在于,该装置包括信号采集设备和检测识别设备;检测识别设备包括过零率判断模块、共振峰判断模块和确定模块;
所述信号采集设备,用于采集音频信号并转化为数字信号,发送给所述检测识别设备;
所述过零率判断模块,用于提取音频信号的过零率,判断是否满足鼾声的过零率特征;
所述共振峰判断模块,用于提取音频信号的共振峰特性,判断共振峰特性是否满足条件L1和条件L2;所述条件L1为:获取最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1,当Q1在鼾声对应的第一比值范围内,则认为满足条件L1;所述条件L2为:当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2,当Q2在鼾声对应的第二比值范围内,则认为满足条件L2;如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性;
所述确定模块,用于在音频信号同时满足鼾声的过零率特征和共振峰特性时,判定检测到鼾声。
8.如权利要求7所述的装置,其特征在于,所述过零率判断模块对音频信号进行加窗分帧处理,求每帧信号的过零率,将设定的判断周期内所有帧信号过零率均值作为音频信号过零率;如果音频信号过零率在所设过零率阈值范围内,则判定音频信号满足鼾声的过零率特征;所述过零率阈值范围为[40,110]。
9.如权利要求7所述的装置,其特征在于,所述共振峰判断模块包括特征值提取子模块、L2条件判断子模块、L1条件判断子模块和综合判断子模块;
特征值提取子模块,用于从音频信号获取各个共振峰的峰值、频率及带宽;
L2条件判断子模块,用于当音频信号存在频率低于频率阈值θ的共振峰Pd时,获取最高峰共振峰与共振峰Pd的峰值之比Q2;判断比值Q2是否在鼾声对应的第二比值范围内,如果是则判定满足条件L2;将判定结果告知综合判断子模块;
L1条件判断子模块,用于获取音频信号最高共振峰处的共振峰频率fmax和带宽Wmax的比值Q1;判断比值Q1是否在鼾声对应的第一比值范围内;如果是,则判定满足条件L1;将判定结果告知综合判断子模块;
综合判断子模块,用于接收来自L2条件判断子模块和L1条件判断子模块的判断结果;如果存在共振峰Pd,则当同时满足条件L1和条件L2时,判定当前语音信号满足鼾声的共振峰特性;如果不存在共振峰Pd,则当满足条件L1时,判定当前语音信号满足鼾声的共振峰特性。
10.如权利要求9所述的装置,其特征在于,L2条件判断子模块在判定满足条件L2或者在检测到不存在共振峰Pd时,通知L1条件判断子模块进行处理;L1条件判断子模块在收到通知后,进行L1条件是否满足的判断;
所述综合判断子模块先考虑L2条件判断子模块的判定结果,如果判定结果显示不满足条件L2,则直接判定当前语音信号不满足鼾声的共振峰特性;如果判定结果显示满足条件L2或者不存在共振峰Pd,则进一步考虑L1条件判断子模块的判定结果,如果此时条件L1的判定结果显示满足条件L1,则确定当前音频信号满足鼾声的共振峰特性。
11.如权利要求7所述的装置,其特征在于,所述条件L1中,鼾声对应的第一比值范围为与最高共振峰的峰值频率fmax有关;所述共振峰判断模块预存有各种fmax对应的第一比值范围;根据当前语音信号的fmax,提取对应的第一比值范围进行条件L1的判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910871659.7A CN110634504B (zh) | 2019-09-16 | 2019-09-16 | 一种鼾声检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910871659.7A CN110634504B (zh) | 2019-09-16 | 2019-09-16 | 一种鼾声检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110634504A CN110634504A (zh) | 2019-12-31 |
CN110634504B true CN110634504B (zh) | 2021-09-21 |
Family
ID=68971330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910871659.7A Active CN110634504B (zh) | 2019-09-16 | 2019-09-16 | 一种鼾声检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110634504B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113759358A (zh) * | 2021-09-08 | 2021-12-07 | 苏州捷杰传感技术有限公司 | 一种埋地管道的探测方法以及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102138795A (zh) * | 2011-02-21 | 2011-08-03 | 上海大学 | 根据鼾声声学特征确定阻塞性睡眠呼吸暂停与低通气综合症严重程度的方法 |
CN102499637A (zh) * | 2011-09-26 | 2012-06-20 | 大连理工大学 | 阻塞性睡眠呼吸暂停低通气综合症筛查方法及其装置 |
JP2014014543A (ja) * | 2012-07-10 | 2014-01-30 | Tokyo Metropolitan Univ | 判断システム、判断方法、及び判断システム用のプログラム |
CN110013222A (zh) * | 2019-04-03 | 2019-07-16 | 杭州电子科技大学 | 一种用于睡眠呼吸暂停检测的系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014115115A2 (en) * | 2013-01-24 | 2014-07-31 | B. G. Negev Technologies And Applications Ltd. | Determining apnea-hypopnia index ahi from speech |
CA2931662C (en) * | 2015-11-03 | 2023-09-26 | University Health Network | Acoustic upper airway assessment system and method, and sleep apnea assessment system and method relying thereon |
-
2019
- 2019-09-16 CN CN201910871659.7A patent/CN110634504B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102138795A (zh) * | 2011-02-21 | 2011-08-03 | 上海大学 | 根据鼾声声学特征确定阻塞性睡眠呼吸暂停与低通气综合症严重程度的方法 |
CN102499637A (zh) * | 2011-09-26 | 2012-06-20 | 大连理工大学 | 阻塞性睡眠呼吸暂停低通气综合症筛查方法及其装置 |
JP2014014543A (ja) * | 2012-07-10 | 2014-01-30 | Tokyo Metropolitan Univ | 判断システム、判断方法、及び判断システム用のプログラム |
CN110013222A (zh) * | 2019-04-03 | 2019-07-16 | 杭州电子科技大学 | 一种用于睡眠呼吸暂停检测的系统 |
Non-Patent Citations (3)
Title |
---|
"Spectral Envelope Analysis for Simple Snorers and Obstructive Sleep Apnea Patients";Mustafa Cavusoglu 等;《 2007 IEEE 15th Signal Processing and Communications Applications》;20070904;全文 * |
"基于AHI指数的OSAHS筛查系统的研究与实现";杨贺;《中国优秀硕士学位论文全文数据库(医药卫生科技辑)》;20160315;全文 * |
"鼾声信号检测与分析算法研究";马干军;《中国优秀硕士学位论文全文数据库(马干军)》;20170215;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110634504A (zh) | 2019-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108896878B (zh) | 一种基于超声波的局部放电检测方法 | |
Taplidou et al. | Wheeze detection based on time-frequency analysis of breath sounds | |
US8834386B2 (en) | Noise reduction of breathing signals | |
Vijayalakshmi et al. | Acoustic analysis and detection of hypernasality using a group delay function | |
EP2643981B1 (en) | A device comprising a plurality of audio sensors and a method of operating the same | |
Lin et al. | Automatic wheezing detection using speech recognition technique | |
WO2020238954A1 (zh) | 呼吸暂停监测的方法及装置 | |
CN110013222A (zh) | 一种用于睡眠呼吸暂停检测的系统 | |
CN110942784A (zh) | 基于支持向量机的鼾声分类系统 | |
CN109545239B (zh) | 用于采集体音信号的双麦克风自适应滤波算法及应用 | |
Zhang et al. | A novel wheeze detection method for wearable monitoring systems | |
CN110634504B (zh) | 一种鼾声检测方法和装置 | |
WO2016004757A1 (zh) | 杂音检测方法和装置 | |
CN109497956A (zh) | 止鼾系统及其控制方法 | |
CN111613210A (zh) | 一种各类呼吸暂停综合征的分类检测系统 | |
US20220346705A1 (en) | Apparatus and method for sleep-disordered breathing estimation based on sound analysis | |
Dubey et al. | Pitch-Adaptive Front-end Feature for Hypernasality Detection. | |
JP2007264567A (ja) | 音声中の非発話音声の判別処理方法 | |
US20100210962A1 (en) | Respiratory signal detection and time domain signal processing method and system | |
WO2015000401A1 (zh) | 音频信号分类处理方法、装置及设备 | |
Rapcan et al. | The use of telephone speech recordings for assessment and monitoring of cognitive function in elderly people | |
JP3520430B2 (ja) | 左右音像方向抽出方法 | |
CN111933181B (zh) | 基于复数阶导数处理的鼾声特征提取、检测方法及其装置 | |
Jovicic et al. | Time-frequency detection of stridence in fricatives and affricates | |
CN113763985B (zh) | 一种基于声音识别生理现象的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |