CN109645957A - 一种鼾声来源分类方法 - Google Patents
一种鼾声来源分类方法 Download PDFInfo
- Publication number
- CN109645957A CN109645957A CN201811572356.7A CN201811572356A CN109645957A CN 109645957 A CN109645957 A CN 109645957A CN 201811572356 A CN201811572356 A CN 201811572356A CN 109645957 A CN109645957 A CN 109645957A
- Authority
- CN
- China
- Prior art keywords
- sound
- snoring
- signal
- segment
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010041235 Snoring Diseases 0.000 title claims abstract description 200
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000003044 adaptive effect Effects 0.000 claims abstract description 31
- 238000001228 spectrum Methods 0.000 claims abstract description 23
- 230000006835 compression Effects 0.000 claims abstract description 18
- 238000007906 compression Methods 0.000 claims abstract description 18
- 230000002708 enhancing effect Effects 0.000 claims abstract description 13
- 238000012706 support-vector machine Methods 0.000 claims abstract description 7
- 238000000513 principal component analysis Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000009432 framing Methods 0.000 claims abstract description 4
- 210000001584 soft palate Anatomy 0.000 claims description 17
- 210000003800 pharynx Anatomy 0.000 claims description 12
- 210000005181 root of the tongue Anatomy 0.000 claims description 12
- 210000002409 epiglottis Anatomy 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 210000001519 tissue Anatomy 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 9
- 230000017105 transposition Effects 0.000 claims description 7
- 210000000981 epithelium Anatomy 0.000 claims description 6
- 230000035876 healing Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical group C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 238000010276 construction Methods 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 10
- 230000001225 therapeutic effect Effects 0.000 abstract description 2
- 230000002401 inhibitory effect Effects 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/48—Other medical applications
- A61B5/4803—Speech analysis specially adapted for diagnostic purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种鼾声来源分类方法。该方法针对鼾症患者的鼾声来源分类问题,首先采集鼾声数据信号,并进行预加重、分帧、加窗处理等预处理以及自适应增强处理,有效抑制鼾声数据中的环境噪声,从而得到较为纯净的鼾声信号;然后针对鼾声片段谱图提取能够反映谱能量变化信息的梯度方向直方图特征,并通过多线性主成分分析算法进行特征压缩;最后利用支持向量机分类器实现鼾声来源分类。本发明能够在噪声环境下获得较好的分类性能,运行效率高且易于实现,对确定鼾症患者的治疗方案有重要的医学价值。
Description
技术领域
本发明属于生物医学及声信号识别技术领域,特别涉及一种鼾声来源分类方法。
背景技术
鼾症是一种常见的睡眠呼吸疾病,会严重影响患者的生活质量,而鼾声来源是选择针对性治疗方案的重要依据,因此确定鼾声来源具有重要意义。目前临床常用的鼾声来源确定方法为药物诱导睡眠内镜,但该方法操作复杂、价格昂贵且会使患者感到不适,不易推广普及。由于鼾声来源于上气道组织振动,对鼾声信号进行声学分析是一种确定鼾声来源的可行方案,且具有操作方便、非侵入式等优点。
其中,利用声学信号分析手段进行鼾声来源分类主要是针对鼾声片段提取特征,然后将其输入特定的分类器以获得分类结果。近年来已有学者提出基于多种常用声学特征的鼾声来源分类方法(许志勇,钱昆,吴亚琦,等.基于多特征的夜间睡眠声信号分析方法:中国,201310295535.1[P].2013-07-15;Qian K,Janott C,Pandit V,etal.Classification of the Excitation Location of Snore Sounds in the UpperAirway by Acoustic Multi-Feature Analysis[J].IEEE transactions on bio-medicalengineering,2017,64(8):1731-1741.),但是这些研究未考虑背景噪声对分类性能的不利影响,不适用于低信噪比环境。此外实验验证仅采用来源于单一上气道组织振动的鼾声数据,而实际情况中多个不同上气道组织混合振动在鼾症患者中也非常普遍。
由此可知,现有技术存在方法不全面、功能单一等缺陷。
发明内容
本发明所要解决的技术问题在于提供一种针对鼾症患者的鼾声来源分类问题的方法。
实现本发明目的的技术解决方案为:一种鼾声来源分类方法,包括以下步骤:
步骤1、采集鼾声数据信号并进行预处理;
步骤2、对预处理后的鼾声数据信号进行自适应增强处理;
步骤3、根据步骤2增强处理后的鼾声数据信号获取若干个鼾声片段,对每个鼾声片段提取压缩梯度方向直方图特征;
步骤4、基于步骤3提取的鼾声片段对应的压缩梯度方向直方图特征,对该鼾声片段进行鼾声来源分类。
本发明与现有技术相比,其显著优点为:1)本发明中采用自适应鼾声增强方法能有效滤除环境噪声,能够适用于低信噪比环境;2)本发明中采用梯度方向直方图特征,从图像域角度反映鼾声信号的谱能量变化情况,能有效区分不同来源的鼾声信号;3)本发明采用多线性主成分分析算法进行特征压缩,有效降低了计算复杂度,提高运行效率;4)本发明对不同来源的鼾声均具有良好的分类性能;5)本发明操作简便,易于实施。
下面结合附图对本发明作进一步详细的描述。
附图说明
图1为本发明鼾声来源分类方法的流程图。
图2为本发明实施例中来源于不同上气道组织振动模式的鼾声信号的典型时频谱图;其中图(a)为单软腭振动,图(b)为单咽侧壁振动,图(c)为单舌根/会厌振动,图(d)为软腭和咽侧壁共同振动,图(e)为软腭和舌根/会厌共同振动,图(f)为软腭、咽侧壁、舌根/会厌共同振动,图(g)为无明显组织振动。
具体实施方式
结合图1,本发明的一种鼾声来源分类方法,包括以下步骤:
步骤1、采集鼾声数据信号并进行预处理。
进一步地,步骤1采集鼾声数据信号并进行预处理,具体为:
步骤1-1、利用N元麦克风阵列采集鼾声数据信号;其中N为麦克风阵列中麦克风的数目;
步骤1-2、对采集的鼾声数据信号进行预处理具体包括:预加重和分帧、加窗处理。
步骤2、对预处理后的鼾声数据信号进行自适应增强处理。
进一步地,步骤2具体为:
步骤2-1、求取每帧鼾声数据信号的短时能量E(l):
式中,x'l(m)为第l帧信号第m个采样点的幅度值,M为帧长,L为总帧数;根据所有帧鼾声数据信号的短时能量分布,自定义设置高低两个门限值,并将短时能量高于高门限值的帧作为鼾声帧,短时能量低于低门限值的帧作为噪声帧;
步骤2-2、将N元麦克风阵列中的某一个通道作为主通道,其余通道作为辅助通道;基于步骤2-1获得的鼾声帧数据信号通过自适应滤波方法估计主通道与每个辅助通道接收信号间的时延;具体为:
令主通道编号为1,n时刻的鼾声帧数据信号表示为x1(n);其余通道编号为2至N,第i通道n时刻的鼾声帧数据信号表示为xi(n),其中2≤i≤N;
步骤2-2-1、将xi(n)通过一个2k+1阶的FIR滤波器,利用自适应算法调整FIR滤波器的权值使输出信号最大程度上接近x1(n),其中k的取值为:
k=d1i/c
式中,d1i为阵元1与阵元i之间的距离,c为声速;
步骤2-2-2、对FIR滤波器的权值进行峰值检测,令峰值对应的横坐标为zi,则通道i与主通道1信号之间的时延采样点数为:λi=zi-k;
通过步骤2-2-1至步骤2-2-2获得主通道与每个辅助通道信号间的时延;
步骤2-3、对辅助通道信号进行时延补偿,并基于时延补偿后的辅助通道信号获取和、差两个通道信号;具体为:
和通道信号为将主通道信号与时延补偿后的辅助通道信号相加并求平均,噪声信号因非同相叠加得到一定抑制,输出信号中包含期望信号和残留噪声,将其作为参考信号d(n):
差通道信号为将主通道信号与时延补偿后的辅助通道信号分别相减并构成N-1维向量,输出信号中鼾声信号被消除,仅保留噪声信号,将其作为噪声参考信号x(n):
x(n)=[x1(n)-x2(n-λ2),x1(n)-x3(n-λ3),…,x1(n)-xN(n-λN)]T
式中,上标T表示转置;
步骤2-4、根据步骤2-3的和、差通道信号获取自适应增强后的鼾声数据信号,具体为:
步骤2-4-1、将和通道信号作为维纳滤波器的主通道信号,差通道信号作为维纳滤波器的辅助通道信号,通过自适应算法调整维纳滤波器权值对差通道信号进行最优估计,获得维纳滤波器最优的估计权值
步骤2-4-2、根据步骤2-3的和、差通道信号以及步骤2-4-1的维纳滤波器最优的估计权值获得自适应增强后的鼾声数据信号e(n)为:
进一步地,步骤2-2-1中的自适应算法为最小均方算法。
进一步地,步骤2-4-1中自适应算法采用块自适应算法;通过块自适应算法调整维纳滤波器权值对差通道信号进行最优估计,获得维纳滤波器最优的估计权值具体为:
步骤2-4-1-1、假设每个数据块由K个快拍数据构成,利用第p个数据块估计差通道信号的协方差矩阵为:
步骤2-4-1-2、求取和通道信号与差通道信号的互相关向量为:
步骤2-4-1-3、根据维纳-霍夫方程求取维纳滤波器最优的估计权值为:
步骤3、根据步骤2增强处理后的鼾声数据信号获取若干个鼾声片段,对每个鼾声片段提取压缩梯度方向直方图特征。
进一步地,步骤3具体为:
步骤3-1、根据步骤2增强处理后的鼾声数据信号,将连续的鼾声帧作为一个鼾声片段,由此获得若干个鼾声片段;
步骤3-2、对每个鼾声片段进行短时傅里叶变换,第j个鼾声片段的时频谱图为:
SPj=[sp(1),sp(2),…,sp(l),…,sp(L)]
式中,L表示帧数,第l帧频域向量为:
sp(l)=[|S(0,l)|,|S(1,l)|,…,|S(f,l)|,…,|S(N/2-1,l)|]T
式中,1≤l≤L,上标T表示转置,S(f,l)表示在时频点(f,l)处的短时傅里叶变换结果,0≤f≤N/2-1,N为每帧信号进行快速傅里叶变换的点数,f为频率序号;
步骤3-3、利用插值算法调整所有鼾声片段时频谱图的尺寸为L',L'为所有鼾声片段时频谱图的尺寸平均值向上取整;
步骤3-4、基于鼾声片段时频谱图,提取每个鼾声片段的梯度方向直方图特征;
步骤3-5、通过多线性主成分分析算法对步骤3-5提取的梯度方向直方图特征进行降维,获得压缩梯度方向直方图特征。
进一步地,步骤3-3中差值算法采用最近邻插值法。
进一步地,步骤3-4基于鼾声片段时频谱图,提取每个鼾声片段的梯度方向直方图特征,具体为:
步骤3-4-1、求取每个鼾声片段的时频谱图中每个时频点的梯度;
步骤3-4-2、将每个鼾声片段的时频谱图平均划分为若干个单元,统计每个单元中所有时频点的梯度方向,获得该单元的梯度方向直方图特征向量;
步骤3-4-3、将相邻的若干个单元组合构成若干个区域,每个区域的梯度方向直方图特征向量由该区域内所有单元的梯度方向直方图特征向量拼接并归一化处理获得,所有区域的梯度方向直方图特征向量组合构成鼾声片段的梯度方向直方图特征。
步骤4、基于步骤3提取的鼾声片段对应的压缩梯度方向直方图特征,对该鼾声片段进行鼾声来源分类。
进一步地,步骤4采用支持向量机分类器对鼾声来源进行分类。
进一步地,步骤4具体为:
步骤4-1、将已知来源类别即上气道组织振动模式类别的若干类鼾声片段作为训练集,待分类的鼾声片段作为测试集;
步骤4-2、将训练集中所有鼾声片段的压缩梯度方向直方图特征输入支持向量机分类器,并利用“one-versus-one”策略构造分类模型;
步骤4-3、将测试集中每个鼾声片段的压缩梯度方向直方图特征输入步骤4-2构造的分类模型中即获取该鼾声片段的来源类别。其中鼾声片段的来源类别包括单软腭振动,单咽侧壁振动,单舌根/会厌振动,软腭和咽侧壁共同振动,软腭和舌根/会厌共同振动,软腭、咽侧壁、舌根/会厌共同振动以及无明显组织振动。
下面结合实施例对本发明进行更详细的描述。
实施例
针对鼾症患者的鼾声来源确定问题,提出了一种鼾声来源分类方法,该方法适用于噪声环境下的多种鼾声来源分类问题。具体过程为针对麦克风阵列采集的鼾声数据,通过自适应鼾声增强方法抑制环境噪声,然后提取出鼾声片段,针对每个片段的时频谱图提取能够描述谱能量变化情况的梯度方向直方图特征,并通过多线性主成份分析算法进行特征压缩,最后利用支持向量机分类器进行分类。
结合图1,本发明鼾声来源分类方法,步骤如下:
步骤1、在手术室中通过N元麦克风阵列采集不同来源的鼾声数据,并进行预处理。本实施例通过放置于病床床头的四元弧形麦克风阵列进行鼾声采集,共采集了7种来源的鼾声数据,分别为单软腭振动、单咽侧壁振动、单舌根/会厌振动、软腭和咽侧壁共同振动、软腭和舌根/会厌共同振动、软腭咽侧壁和舌根/会厌共同振动、无明显组织振动。预处理过程首先通过一阶数字滤波器对数据进行预加重,然后通过汉明窗进行分帧加窗,本实施例中帧长取为64ms,帧移取为32ms。
步骤2、对预处理后的鼾声数据信号进行自适应鼾声增强。首先根据短时帧能量将鼾声数据信号划分为鼾声帧和噪声帧。针对本实施例中的四元麦克风阵列,以其中一个通道作为主通道,其余三路通道作为辅助通道,基于鼾声帧数据自适应估计主通道与辅助通道接收信号间的时延。根据估计的时延对辅助通道信号进行时延补偿,并将主通道和辅助通道的和差通道输出送入维纳滤波器进行噪声抵消。具体过程如下:
(1)对每帧信号计算短时帧能量:
式中,x'l(m)为第l帧信号第m个采样点的幅度值,M为帧长,L为总帧数;根据所有帧鼾声数据信号的短时能量分布,自定义设置高低两个门限值,并将短时能量高于高门限值的帧作为鼾声帧,短时能量低于低门限值的帧作为噪声帧;
(2)将四元麦克风阵列中一个通道设置为主通道,其余通道为辅助通道,基于鼾声帧数据通过自适应滤波方法估计主通道与辅助通道接收信号间的时延。令主通道编号为1,n时刻输入信号表示为x1(n)。其余通道编号为2、3、4,第i(i=2,3,4)通道n时刻输入信号表示为xi(n)。将xi(n)通过一个2k+1阶的FIR滤波器,自适应调整滤波器权值使输出信号最大程度上接近x1(n),其中k的取值基于最大可能时延d1i/c,d1i为阵元1与阵元i之间的距离,c为声速,本实施例中k取值为32。滤波器的权值根据最小均方算法自适应估计得到,对其进行峰值检测,令峰值对应横坐标为zi,通道i与主通道信号之间的时延采样点数即为λi=zi-k;
(3)对辅助通道信号进行时延补偿后,得到和、差两个通道信号。
和通道信号为将主通道信号与时延补偿后的辅助通道信号相加并求平均,噪声信号因非同相叠加得到一定抑制,输出信号中包含期望信号和残留噪声,可将其作为参考信号:
差通道信号为将主通道信号与时延补偿后的辅助通道信号分别相减并构成3维向量,输出信号中鼾声信号被消除,仅保留噪声信号,可将其作为噪声参考信号:
x(n)=[x1(n)-x2(n-λ2),x1(n)-x3(n-λ3),x1(n)-x3(n-λ3)]T
其中上标T表示转置;
(4)将和通道信号作为维纳滤波器的主通道信号,差通道信号作为辅助通道信号,通过自适应算法调整维纳滤波器权值从而对差通道的噪声参考信号进行最优估计,随后将主通道信号减去噪声估计信号以实现噪声相消。滤波器权值通过块自适应算法进行更新。假设每个数据块由K个快拍数据构成,利用第p个数据块估计差通道信号的协方差矩阵为:
和通道信号与差通道信号的互相关向量为:
根据维纳-霍夫方程求取维纳滤波器最优的估计权值为:
为避免鼾声信号相消,滤波器权值仅在噪声帧中更新。经维纳滤波器的噪声相消后输出的较为纯净的鼾声信号可表示为:
步骤3、在得到的已增强鼾声数据中提取出鼾声片段。图2为7种来源鼾声片段的典型时频谱图,可看出不同来源的鼾声信号在频域能量分布上有一定区别,因此针对每个鼾声片段提取可描述鼾声谱能量变化信息的梯度方向直方图特征,然后通过多线性主成分分析算法进行特征压缩,提高运行效率。具体内容为:
(1)根据上述步骤2增强处理后的鼾声数据信号,将连续的鼾声帧作为一个鼾声片段,由此获得若干个鼾声片段;
(2)对鼾声片段进行短时傅里叶变换得到时频谱图,第j个鼾声片段的时频谱图为:
SPj=[sp(1),sp(2),…,sp(l),…,sp(L)]
式中,L表示帧数,第l帧(1≤l≤L)频域向量为:
sp(l)=[|S(0,l)|,|S(1,l)|,…,|S(f,l)|,…,|S(N/2-1,l)|]T
其中,上上标T表示转置,S(f,l)表示在时频点(f,l)处的短时傅里叶变换结果,0≤f≤N/2-1,N为每帧信号进行快速傅里叶变换的点数,f为频率序号。本实施例中N为512点,因此谱图尺寸为256×L;
(3)采用最邻近插值算法将所有鼾声片段谱图的尺寸L统一调整为64;
(4)提取梯度方向直方图特征。首先计算谱图中每个时频点的梯度,然后将谱图划分为小的单元,统计单元中所有时频点的梯度方向构成该单元的梯度方向直方图特征。将相邻的单元组合成大的区域,每个区域的特征向量由该区域内所有单元的特征拼接并经归一化处理得到。最终获得的特征由该谱图中所有区域的特征向量组合而成。本实施例中每个单元包含8×8个时频点,统计梯度方向时将方向区间平均划分成9个直方图通道,因此可得到一个9维的特征向量。每个区域由2×2个单元构成,相邻区域之间重叠50%,最终对于第j个鼾声片段可得到一个31×7×36的特征张量,记为Xj。
(5)通过多线性主成分分析算法进行特征降维。在尽可能保留特征信息的前提下将得到的特征张量从原张量空间投影至低维空间,公式为:
Yj=Xj×1U(1)T×2U(2)T×3U(3)T
式中,Yj为第j个片段经投影后的低维特征张量,U(n)(1≤n≤3)为投影矩阵,其值以Yj散度最大为条件迭代求解得到,X×nU为张量X与矩阵U的模n积,T为转置。因投影后张量中的特征元素相互独立,可进一步选择其中分类能力较强的若干个特征元素构成最终的特征向量,其中分类能力定义为类间散度和类内散度的比值。针对大量实测数据的实验研究显示,压缩梯度方向直方图特征维度为120时可获得较好的分类性能。
步骤4、根据提取出的压缩梯度方向直方图特征,采用基于“one-versus-one”策略构造多分类支持向量机以实现鼾声来源分类。本实施例中采用LIBSVM工具箱,选用径向基核函数,并采用自动寻优方式设置惩罚因子c和核参数g,最终对应参数为c=4,g=0.125。分类性能通过平均分类正确率CA、查准率precision、查全率recall、F1度量等评价指标进行评估,定义分别如下:
式中,NT表示测试样本总个数,NC表示分类正确的测试样本总个数,TP(TruePositive)和FP(False Positive)分别表示测试集中该类所有正例被正确和错误分类的数目,而FN(False Negative)则指测试集中该类所有负例被错误分类的数目。
实施例进行了100次鼾声来源分类实验,每次实验采用无放回方式从每类鼾声中随机抽取60%样本(实验中每个片段对应特征向量称为一个样本)作为总体训练集,余下每类40%样本共同组成总体测试集,并对测试集的分类结果进行性能评估。实验显示100次实验获得的平均分类正确率为89.8%,同时下表1给出了7类来源鼾声各自的平均查准率、查全率以及F1度量结果,由表中结果可知,除软腭和咽侧壁共同振动来源的鼾声平均查准率、查全率以及F1度量在83%-86%之间以外,其余6类鼾声的各项指标均不低于88%。综合总体分类性能和每类鼾声的分类性能,可证明本发明方法性能良好,适用于实际情况中鼾症患者鼾声来源的确定问题。
表1 100次鼾声来源分类实验中各类平均查准率、查全率以及F1度量
本发明的方法以麦克风阵列采集的鼾声数据为基础,采用自适应鼾声增强方法抑制数据中的环境噪声,并针对鼾声片段谱图提取可用于描述鼾声谱能量变化信息的压缩梯度方向直方图特征,最后基于支持向量机分类器进行鼾声来源分类。通过本发明的方法,可以利用鼾声信号确定鼾症患者的鼾声来源,对于鼾症治疗方案的选择具有重要的医学价值。
Claims (10)
1.一种鼾声来源分类方法,其特征在于,包括以下步骤:
步骤1、采集鼾声数据信号并进行预处理;
步骤2、对预处理后的鼾声数据信号进行自适应增强处理;
步骤3、根据步骤2增强处理后的鼾声数据信号获取若干个鼾声片段,对每个鼾声片段提取压缩梯度方向直方图特征;
步骤4、基于步骤3提取的鼾声片段对应的压缩梯度方向直方图特征,对该鼾声片段进行鼾声来源分类。
2.根据权利要求1所述的鼾声来源分类方法,其特征在于,步骤1所述采集鼾声数据信号并进行预处理,具体为:
步骤1-1、利用N元麦克风阵列采集鼾声数据信号;其中N为麦克风阵列中麦克风的数目;
步骤1-2、对采集的鼾声数据信号进行预处理具体包括:预加重和分帧、加窗处理。
3.根据权利要求2所述的鼾声来源分类方法,其特征在于,步骤2所述对预处理后的鼾声数据信号进行自适应增强处理,具体为:
步骤2-1、求取每帧鼾声数据信号的短时能量E(l):
式中,x'l(m)为第l帧信号第m个采样点的幅度值,M为帧长,L为总帧数;根据所有帧鼾声数据信号的短时能量分布,自定义设置高低两个门限值,并将短时能量高于高门限值的帧作为鼾声帧,短时能量低于低门限值的帧作为噪声帧;
步骤2-2、将N元麦克风阵列中的某一个通道作为主通道,其余通道作为辅助通道;基于步骤2-1获得的鼾声帧数据信号通过自适应滤波方法估计主通道与每个辅助通道接收信号间的时延;具体为:
令主通道编号为1,n时刻的鼾声帧数据信号表示为x1(n);其余通道编号为2至N,第i通道n时刻的鼾声帧数据信号表示为xi(n),其中2≤i≤N;
步骤2-2-1、将xi(n)通过一个2k+1阶的FIR滤波器,利用自适应算法调整FIR滤波器的权值使输出信号最大程度上接近x1(n),其中k的取值为:
k=d1i/c
式中,d1i为阵元1与阵元i之间的距离,c为声速;
步骤2-2-2、对FIR滤波器的权值进行峰值检测,令峰值对应的横坐标为zi,则通道i与主通道1信号之间的时延采样点数为:λi=zi-k;
通过步骤2-2-1至步骤2-2-2获得主通道与每个辅助通道信号间的时延;
步骤2-3、对辅助通道信号进行时延补偿,并基于时延补偿后的辅助通道信号获取和、差两个通道信号;具体为:
和通道信号为将主通道信号与时延补偿后的辅助通道信号相加并求平均,将其作为参考信号d(n):
差通道信号为将主通道信号与时延补偿后的辅助通道信号分别相减并构成N-1维向量,将其作为噪声参考信号x(n):
x(n)=[x1(n)-x2(n-λ2),x1(n)-x3(n-λ3),…,x1(n)-xN(n-λN)]T
式中,上标T表示转置;
步骤2-4、根据步骤2-3的和、差通道信号获取自适应增强后的鼾声数据信号,具体为:
步骤2-4-1、将和通道信号作为维纳滤波器的主通道信号,差通道信号作为维纳滤波器的辅助通道信号,通过自适应算法调整维纳滤波器权值对差通道信号进行最优估计,获得维纳滤波器最优的估计权值
步骤2-4-2、根据步骤2-3的和、差通道信号以及步骤2-4-1的维纳滤波器最优的估计权值获得自适应增强后的鼾声数据信号e(n)为:
4.根据权利要求3所述的鼾声来源分类方法,其特征在于,步骤2-2-1所述自适应算法为最小均方算法。
5.根据权利要求3所述的鼾声来源分类方法,其特征在于,步骤2-4-1所述自适应算法采用块自适应算法;通过块自适应算法调整维纳滤波器权值对差通道信号进行最优估计,获得维纳滤波器最优的估计权值具体为:
步骤2-4-1-1、假设每个数据块由K个快拍数据构成,利用第p个数据块估计差通道信号的协方差矩阵为:
步骤2-4-1-2、求取和通道信号与差通道信号的互相关向量为:
步骤2-4-1-3、根据维纳-霍夫方程求取维纳滤波器最优的估计权值为:
6.根据权利要求4或5所述的鼾声来源分类方法,其特征在于,步骤3所述根据步骤2增强处理后的鼾声数据信号获取若干个鼾声片段,对每个鼾声片段提取压缩梯度方向直方图特征,具体为:
步骤3-1、根据步骤2增强处理后的鼾声数据信号,将连续的鼾声帧作为一个鼾声片段,由此获得若干个鼾声片段;
步骤3-2、对每个鼾声片段进行短时傅里叶变换,第j个鼾声片段的时频谱图为:
SPj=[sp(1),sp(2),…,sp(l),…,sp(L)]
式中,L表示帧数,第l帧频域向量为:
sp(l)=[|S(0,l)|,|S(1,l)|,…,|S(f,l)|,…,|S(N/2-1,l)|]T
式中,1≤l≤L,上标T表示转置,S(f,l)表示在时频点(f,l)处的短时傅里叶变换结果,0≤f≤N/2-1,N为每帧信号进行快速傅里叶变换的点数,f为频率序号;
步骤3-3、利用插值算法调整所有鼾声片段时频谱图的尺寸为L',L'为所有鼾声片段时频谱图的尺寸平均值向上取整;
步骤3-4、基于鼾声片段时频谱图,提取每个鼾声片段的梯度方向直方图特征;
步骤3-5、通过多线性主成分分析算法对步骤3-5提取的梯度方向直方图特征进行降维,获得压缩梯度方向直方图特征。
7.根据权利要求6所述的鼾声来源分类方法,其特征在于,步骤3-3中所述差值算法具体为最近邻插值法。
8.根据权利要求6或7所述的鼾声来源分类方法,其特征在于,步骤3-4所述基于鼾声片段时频谱图,提取每个鼾声片段的梯度方向直方图特征,具体为:
步骤3-4-1、求取每个鼾声片段的时频谱图中每个时频点的梯度;
步骤3-4-2、将每个鼾声片段的时频谱图平均划分为若干个单元,统计每个单元中所有时频点的梯度方向,获得该单元的梯度方向直方图特征向量;
步骤3-4-3、将相邻的若干个单元组合构成若干个区域,每个区域的梯度方向直方图特征向量由该区域内所有单元的梯度方向直方图特征向量拼接并归一化处理获得,所有区域的梯度方向直方图特征向量组合构成鼾声片段的梯度方向直方图特征。
9.根据权利要求1所述的鼾声来源分类方法,其特征在于,步骤4所述对该鼾声片段进行鼾声来源分类,具体是采用支持向量机分类器对鼾声来源进行分类。
10.根据权利要求9所述的鼾声来源分类方法,其特征在于,步骤4所述基于步骤3提取的鼾声片段对应的压缩梯度方向直方图特征,对该鼾声片段进行鼾声来源分类,具体为:
步骤4-1、将已知来源类别即上气道组织振动模式类别的若干类鼾声片段作为训练集,待分类的鼾声片段作为测试集;
步骤4-2、将训练集中所有鼾声片段的压缩梯度方向直方图特征输入支持向量机分类器,并利用“one-versus-one”策略构造分类模型;
步骤4-3、将测试集中每个鼾声片段的压缩梯度方向直方图特征输入步骤4-2构造的分类模型中即获取该鼾声片段的来源类别,所述鼾声片段的来源类别包括单软腭振动,单咽侧壁振动,单舌根/会厌振动,软腭和咽侧壁共同振动,软腭和舌根/会厌共同振动,软腭、咽侧壁、舌根/会厌共同振动以及无明显组织振动。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811572356.7A CN109645957B (zh) | 2018-12-21 | 2018-12-21 | 一种鼾声来源分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811572356.7A CN109645957B (zh) | 2018-12-21 | 2018-12-21 | 一种鼾声来源分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109645957A true CN109645957A (zh) | 2019-04-19 |
CN109645957B CN109645957B (zh) | 2021-06-08 |
Family
ID=66116293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811572356.7A Active CN109645957B (zh) | 2018-12-21 | 2018-12-21 | 一种鼾声来源分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109645957B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111789577A (zh) * | 2020-07-15 | 2020-10-20 | 天津大学 | 基于cqt和stft深度语谱特征鼾声分类方法及系统 |
CN114027801A (zh) * | 2021-12-17 | 2022-02-11 | 广东工业大学 | 一种睡眠鼾声识别与打鼾抑制方法及系统 |
CN114176563A (zh) * | 2021-12-13 | 2022-03-15 | 中南大学湘雅医院 | 贴附式的无线呼吸监测装置、计算机设备与存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404160A (zh) * | 2008-11-21 | 2009-04-08 | 北京科技大学 | 一种基于音频识别的语音降噪方法 |
US20120027263A1 (en) * | 2010-08-02 | 2012-02-02 | Sony Corporation | Hand gesture detection |
CN103345921A (zh) * | 2013-07-15 | 2013-10-09 | 南京理工大学 | 基于多特征的夜间睡眠声信号分析方法 |
CN103690168A (zh) * | 2013-12-31 | 2014-04-02 | 中国科学院深圳先进技术研究院 | 阻塞型睡眠呼吸暂停综合征检测方法及系统 |
US20140171815A1 (en) * | 2012-12-14 | 2014-06-19 | Te-Chung Isaac Yang | Classification of Segments of Acoustic Physiological Signal Captured During Sleep Using Phase-Locked Loop Array |
CN104083160A (zh) * | 2014-06-30 | 2014-10-08 | 天津大学 | 一种基于机器视觉的睡眠状态监测方法及装置 |
CN105962897A (zh) * | 2016-04-27 | 2016-09-28 | 南京理工大学 | 一种自适应的鼾声信号检测方法 |
CN106821337A (zh) * | 2017-04-13 | 2017-06-13 | 南京理工大学 | 一种有监督的鼾声来源识别方法 |
CN108431890A (zh) * | 2015-12-18 | 2018-08-21 | 高通股份有限公司 | 多音频信号的编码 |
CN108938175A (zh) * | 2018-07-25 | 2018-12-07 | 深圳市华信物联传感技术有限公司 | 一种止鼾系统及方法 |
-
2018
- 2018-12-21 CN CN201811572356.7A patent/CN109645957B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404160A (zh) * | 2008-11-21 | 2009-04-08 | 北京科技大学 | 一种基于音频识别的语音降噪方法 |
US20120027263A1 (en) * | 2010-08-02 | 2012-02-02 | Sony Corporation | Hand gesture detection |
US20140171815A1 (en) * | 2012-12-14 | 2014-06-19 | Te-Chung Isaac Yang | Classification of Segments of Acoustic Physiological Signal Captured During Sleep Using Phase-Locked Loop Array |
CN103345921A (zh) * | 2013-07-15 | 2013-10-09 | 南京理工大学 | 基于多特征的夜间睡眠声信号分析方法 |
CN103690168A (zh) * | 2013-12-31 | 2014-04-02 | 中国科学院深圳先进技术研究院 | 阻塞型睡眠呼吸暂停综合征检测方法及系统 |
CN104083160A (zh) * | 2014-06-30 | 2014-10-08 | 天津大学 | 一种基于机器视觉的睡眠状态监测方法及装置 |
CN108431890A (zh) * | 2015-12-18 | 2018-08-21 | 高通股份有限公司 | 多音频信号的编码 |
CN105962897A (zh) * | 2016-04-27 | 2016-09-28 | 南京理工大学 | 一种自适应的鼾声信号检测方法 |
CN106821337A (zh) * | 2017-04-13 | 2017-06-13 | 南京理工大学 | 一种有监督的鼾声来源识别方法 |
CN108938175A (zh) * | 2018-07-25 | 2018-12-07 | 深圳市华信物联传感技术有限公司 | 一种止鼾系统及方法 |
Non-Patent Citations (3)
Title |
---|
QIAN, KUN: "Automatic detection, segmentation and classification of snore related signals from overnight audio recording", 《IET SIGNAL PROCESSING》 * |
吴志彬: "基于声谱图的环境声音识别", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
许辉杰: "鼾症患者鼾声来源影响因素的初步研究", 《临床耳鼻咽喉头颈外科杂志》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111789577A (zh) * | 2020-07-15 | 2020-10-20 | 天津大学 | 基于cqt和stft深度语谱特征鼾声分类方法及系统 |
CN111789577B (zh) * | 2020-07-15 | 2023-09-19 | 天津大学 | 基于cqt和stft深度语谱特征鼾声分类方法及系统 |
CN114176563A (zh) * | 2021-12-13 | 2022-03-15 | 中南大学湘雅医院 | 贴附式的无线呼吸监测装置、计算机设备与存储介质 |
CN114176563B (zh) * | 2021-12-13 | 2023-11-21 | 中南大学湘雅医院 | 贴附式的无线呼吸监测装置、计算机设备与存储介质 |
CN114027801A (zh) * | 2021-12-17 | 2022-02-11 | 广东工业大学 | 一种睡眠鼾声识别与打鼾抑制方法及系统 |
CN114027801B (zh) * | 2021-12-17 | 2022-09-09 | 广东工业大学 | 一种睡眠鼾声识别与打鼾抑制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109645957B (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mendonca et al. | A review of obstructive sleep apnea detection approaches | |
CN108388912B (zh) | 基于多传感器特征优化算法的睡眠分期方法 | |
CN111696575B (zh) | 基于混合神经网络模型的低通气和呼吸暂停检测识别系统 | |
US10007480B2 (en) | Multi-parametric analysis of snore sounds for the community screening of sleep apnea with non-Gaussianity index | |
CN111444747B (zh) | 一种基于迁移学习和空洞卷积的癫痫状态识别方法 | |
CN103251388B (zh) | 基于智能手机平台的打鼾监测方法和监测及防治系统 | |
CN109645957A (zh) | 一种鼾声来源分类方法 | |
Chen et al. | Deep neural network for automatic classification of pathological voice signals | |
CN106821337A (zh) | 一种有监督的鼾声来源识别方法 | |
Qian et al. | Wavelet features for classification of vote snore sounds | |
Johnson et al. | Ability of primary auditory cortical neurons to detect amplitude modulation with rate and temporal codes: neurometric analysis | |
Ankışhan et al. | Comparison of SVM and ANFIS for snore related sounds classification by using the largest Lyapunov exponent and entropy | |
CN105147252A (zh) | 心脏疾病识别及评估方法 | |
Reggiannini et al. | A flexible analysis tool for the quantitative acoustic assessment of infant cry | |
Ghulam Nabi et al. | Wheeze sound analysis using computer-based techniques: A systematic review | |
Hadjileontiadis | A texture-based classification of crackles and squawks using lacunarity | |
Al Osman et al. | On the use of machine learning for classifying auditory brainstem responses: A Scoping Review | |
Liu et al. | Automatic classification of the obstruction site in obstructive sleep apnea based on snoring sounds | |
Kuo et al. | A self-attention-based ensemble convolution neural network approach for sleep stage classification with merged spectrogram | |
Porieva et al. | Investigation of lung sounds features for detection of bronchitis and COPD using machine learning methods | |
Turan et al. | Empirical mode decomposition of throat microphone recordings for intake classification | |
SenthilPandi et al. | Multi-Level Interpretable and Adaptive Representation of EEG Signals for Sleep Scoring Using Ensemble Learning Multi Classifiers | |
Lu et al. | Pulse waveform analysis for pregnancy diagnosis based on machine learning | |
Ravelo-García et al. | Cepstrum coefficients of the RR series for the detection of obstructive sleep apnea based on different classifiers | |
Patel et al. | Different Transfer Learning Approaches for Recognition of Lung Sounds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |