CN109645957A

CN109645957A - 一种鼾声来源分类方法

Info

Publication number: CN109645957A
Application number: CN201811572356.7A
Authority: CN
Inventors: 赵兆; 张怡; 许志勇; 许辉杰
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2018-12-21
Filing date: 2018-12-21
Publication date: 2019-04-19
Anticipated expiration: 2038-12-21
Also published as: CN109645957B

Abstract

本发明公开了一种鼾声来源分类方法。该方法针对鼾症患者的鼾声来源分类问题，首先采集鼾声数据信号，并进行预加重、分帧、加窗处理等预处理以及自适应增强处理，有效抑制鼾声数据中的环境噪声，从而得到较为纯净的鼾声信号；然后针对鼾声片段谱图提取能够反映谱能量变化信息的梯度方向直方图特征，并通过多线性主成分分析算法进行特征压缩；最后利用支持向量机分类器实现鼾声来源分类。本发明能够在噪声环境下获得较好的分类性能，运行效率高且易于实现，对确定鼾症患者的治疗方案有重要的医学价值。

Description

一种鼾声来源分类方法

技术领域

本发明属于生物医学及声信号识别技术领域，特别涉及一种鼾声来源分类方法。

背景技术

鼾症是一种常见的睡眠呼吸疾病，会严重影响患者的生活质量，而鼾声来源是选择针对性治疗方案的重要依据，因此确定鼾声来源具有重要意义。目前临床常用的鼾声来源确定方法为药物诱导睡眠内镜，但该方法操作复杂、价格昂贵且会使患者感到不适，不易推广普及。由于鼾声来源于上气道组织振动，对鼾声信号进行声学分析是一种确定鼾声来源的可行方案，且具有操作方便、非侵入式等优点。

其中，利用声学信号分析手段进行鼾声来源分类主要是针对鼾声片段提取特征，然后将其输入特定的分类器以获得分类结果。近年来已有学者提出基于多种常用声学特征的鼾声来源分类方法(许志勇,钱昆,吴亚琦,等.基于多特征的夜间睡眠声信号分析方法：中国，201310295535.1[P].2013-07-15；Qian K,Janott C,Pandit V,etal.Classification of the Excitation Location of Snore Sounds in the UpperAirway by Acoustic Multi-Feature Analysis[J].IEEE transactions on bio-medicalengineering,2017,64(8):1731-1741.)，但是这些研究未考虑背景噪声对分类性能的不利影响，不适用于低信噪比环境。此外实验验证仅采用来源于单一上气道组织振动的鼾声数据，而实际情况中多个不同上气道组织混合振动在鼾症患者中也非常普遍。

由此可知，现有技术存在方法不全面、功能单一等缺陷。

发明内容

本发明所要解决的技术问题在于提供一种针对鼾症患者的鼾声来源分类问题的方法。

实现本发明目的的技术解决方案为：一种鼾声来源分类方法，包括以下步骤：

步骤1、采集鼾声数据信号并进行预处理；

步骤2、对预处理后的鼾声数据信号进行自适应增强处理；

步骤3、根据步骤2增强处理后的鼾声数据信号获取若干个鼾声片段，对每个鼾声片段提取压缩梯度方向直方图特征；

步骤4、基于步骤3提取的鼾声片段对应的压缩梯度方向直方图特征，对该鼾声片段进行鼾声来源分类。

本发明与现有技术相比，其显著优点为：1)本发明中采用自适应鼾声增强方法能有效滤除环境噪声，能够适用于低信噪比环境；2)本发明中采用梯度方向直方图特征，从图像域角度反映鼾声信号的谱能量变化情况，能有效区分不同来源的鼾声信号；3)本发明采用多线性主成分分析算法进行特征压缩，有效降低了计算复杂度，提高运行效率；4)本发明对不同来源的鼾声均具有良好的分类性能；5)本发明操作简便，易于实施。

下面结合附图对本发明作进一步详细的描述。

附图说明

图1为本发明鼾声来源分类方法的流程图。

图2为本发明实施例中来源于不同上气道组织振动模式的鼾声信号的典型时频谱图；其中图(a)为单软腭振动，图(b)为单咽侧壁振动，图(c)为单舌根/会厌振动，图(d)为软腭和咽侧壁共同振动，图(e)为软腭和舌根/会厌共同振动，图(f)为软腭、咽侧壁、舌根/会厌共同振动，图(g)为无明显组织振动。

具体实施方式

结合图1，本发明的一种鼾声来源分类方法，包括以下步骤：

步骤1、采集鼾声数据信号并进行预处理。

进一步地，步骤1采集鼾声数据信号并进行预处理，具体为：

步骤1-1、利用N元麦克风阵列采集鼾声数据信号；其中N为麦克风阵列中麦克风的数目；

步骤1-2、对采集的鼾声数据信号进行预处理具体包括：预加重和分帧、加窗处理。

步骤2、对预处理后的鼾声数据信号进行自适应增强处理。

进一步地，步骤2具体为：

步骤2-1、求取每帧鼾声数据信号的短时能量E(l)：

式中，x'_l(m)为第l帧信号第m个采样点的幅度值，M为帧长，L为总帧数；根据所有帧鼾声数据信号的短时能量分布，自定义设置高低两个门限值，并将短时能量高于高门限值的帧作为鼾声帧，短时能量低于低门限值的帧作为噪声帧；

步骤2-2、将N元麦克风阵列中的某一个通道作为主通道，其余通道作为辅助通道；基于步骤2-1获得的鼾声帧数据信号通过自适应滤波方法估计主通道与每个辅助通道接收信号间的时延；具体为：

令主通道编号为1，n时刻的鼾声帧数据信号表示为x₁(n)；其余通道编号为2至N，第i通道n时刻的鼾声帧数据信号表示为x_i(n)，其中2≤i≤N；

步骤2-2-1、将x_i(n)通过一个2k+1阶的FIR滤波器，利用自适应算法调整FIR滤波器的权值使输出信号最大程度上接近x₁(n)，其中k的取值为：

k＝d_1i/c

式中，d_1i为阵元1与阵元i之间的距离，c为声速；

步骤2-2-2、对FIR滤波器的权值进行峰值检测，令峰值对应的横坐标为z_i，则通道i与主通道1信号之间的时延采样点数为：λ_i＝z_i-k；

通过步骤2-2-1至步骤2-2-2获得主通道与每个辅助通道信号间的时延；

步骤2-3、对辅助通道信号进行时延补偿，并基于时延补偿后的辅助通道信号获取和、差两个通道信号；具体为：

和通道信号为将主通道信号与时延补偿后的辅助通道信号相加并求平均，噪声信号因非同相叠加得到一定抑制，输出信号中包含期望信号和残留噪声，将其作为参考信号d(n)：

差通道信号为将主通道信号与时延补偿后的辅助通道信号分别相减并构成N-1维向量，输出信号中鼾声信号被消除，仅保留噪声信号，将其作为噪声参考信号x(n)：

x(n)＝[x₁(n)-x₂(n-λ₂),x₁(n)-x₃(n-λ₃),…,x₁(n)-x_N(n-λ_N)]^T

式中，上标T表示转置；

步骤2-4、根据步骤2-3的和、差通道信号获取自适应增强后的鼾声数据信号，具体为：

步骤2-4-1、将和通道信号作为维纳滤波器的主通道信号，差通道信号作为维纳滤波器的辅助通道信号，通过自适应算法调整维纳滤波器权值对差通道信号进行最优估计，获得维纳滤波器最优的估计权值

步骤2-4-2、根据步骤2-3的和、差通道信号以及步骤2-4-1的维纳滤波器最优的估计权值获得自适应增强后的鼾声数据信号e(n)为：

进一步地，步骤2-2-1中的自适应算法为最小均方算法。

进一步地，步骤2-4-1中自适应算法采用块自适应算法；通过块自适应算法调整维纳滤波器权值对差通道信号进行最优估计，获得维纳滤波器最优的估计权值具体为：

步骤2-4-1-1、假设每个数据块由K个快拍数据构成，利用第p个数据块估计差通道信号的协方差矩阵为：

步骤2-4-1-2、求取和通道信号与差通道信号的互相关向量为：

步骤2-4-1-3、根据维纳-霍夫方程求取维纳滤波器最优的估计权值为：

步骤3、根据步骤2增强处理后的鼾声数据信号获取若干个鼾声片段，对每个鼾声片段提取压缩梯度方向直方图特征。

进一步地，步骤3具体为：

步骤3-1、根据步骤2增强处理后的鼾声数据信号，将连续的鼾声帧作为一个鼾声片段，由此获得若干个鼾声片段；

步骤3-2、对每个鼾声片段进行短时傅里叶变换，第j个鼾声片段的时频谱图为：

SP_j＝[sp(1),sp(2),…,sp(l),…,sp(L)]

式中，L表示帧数，第l帧频域向量为：

sp(l)＝[|S(0,l)|,|S(1,l)|,…,|S(f,l)|,…,|S(N/2-1,l)|]^T

式中，1≤l≤L，上标T表示转置，S(f,l)表示在时频点(f,l)处的短时傅里叶变换结果，0≤f≤N/2-1，N为每帧信号进行快速傅里叶变换的点数，f为频率序号；

步骤3-3、利用插值算法调整所有鼾声片段时频谱图的尺寸为L'，L'为所有鼾声片段时频谱图的尺寸平均值向上取整；

步骤3-4、基于鼾声片段时频谱图，提取每个鼾声片段的梯度方向直方图特征；

步骤3-5、通过多线性主成分分析算法对步骤3-5提取的梯度方向直方图特征进行降维，获得压缩梯度方向直方图特征。

进一步地，步骤3-3中差值算法采用最近邻插值法。

进一步地，步骤3-4基于鼾声片段时频谱图，提取每个鼾声片段的梯度方向直方图特征，具体为：

步骤3-4-1、求取每个鼾声片段的时频谱图中每个时频点的梯度；

步骤3-4-2、将每个鼾声片段的时频谱图平均划分为若干个单元，统计每个单元中所有时频点的梯度方向，获得该单元的梯度方向直方图特征向量；

步骤3-4-3、将相邻的若干个单元组合构成若干个区域，每个区域的梯度方向直方图特征向量由该区域内所有单元的梯度方向直方图特征向量拼接并归一化处理获得，所有区域的梯度方向直方图特征向量组合构成鼾声片段的梯度方向直方图特征。

进一步地，步骤4采用支持向量机分类器对鼾声来源进行分类。

进一步地，步骤4具体为：

步骤4-1、将已知来源类别即上气道组织振动模式类别的若干类鼾声片段作为训练集，待分类的鼾声片段作为测试集；

步骤4-2、将训练集中所有鼾声片段的压缩梯度方向直方图特征输入支持向量机分类器，并利用“one-versus-one”策略构造分类模型；

步骤4-3、将测试集中每个鼾声片段的压缩梯度方向直方图特征输入步骤4-2构造的分类模型中即获取该鼾声片段的来源类别。其中鼾声片段的来源类别包括单软腭振动，单咽侧壁振动，单舌根/会厌振动，软腭和咽侧壁共同振动，软腭和舌根/会厌共同振动，软腭、咽侧壁、舌根/会厌共同振动以及无明显组织振动。

下面结合实施例对本发明进行更详细的描述。

实施例

针对鼾症患者的鼾声来源确定问题，提出了一种鼾声来源分类方法，该方法适用于噪声环境下的多种鼾声来源分类问题。具体过程为针对麦克风阵列采集的鼾声数据，通过自适应鼾声增强方法抑制环境噪声，然后提取出鼾声片段，针对每个片段的时频谱图提取能够描述谱能量变化情况的梯度方向直方图特征，并通过多线性主成份分析算法进行特征压缩，最后利用支持向量机分类器进行分类。

结合图1，本发明鼾声来源分类方法，步骤如下：

步骤1、在手术室中通过N元麦克风阵列采集不同来源的鼾声数据，并进行预处理。本实施例通过放置于病床床头的四元弧形麦克风阵列进行鼾声采集，共采集了7种来源的鼾声数据，分别为单软腭振动、单咽侧壁振动、单舌根/会厌振动、软腭和咽侧壁共同振动、软腭和舌根/会厌共同振动、软腭咽侧壁和舌根/会厌共同振动、无明显组织振动。预处理过程首先通过一阶数字滤波器对数据进行预加重，然后通过汉明窗进行分帧加窗，本实施例中帧长取为64ms，帧移取为32ms。

步骤2、对预处理后的鼾声数据信号进行自适应鼾声增强。首先根据短时帧能量将鼾声数据信号划分为鼾声帧和噪声帧。针对本实施例中的四元麦克风阵列，以其中一个通道作为主通道，其余三路通道作为辅助通道，基于鼾声帧数据自适应估计主通道与辅助通道接收信号间的时延。根据估计的时延对辅助通道信号进行时延补偿，并将主通道和辅助通道的和差通道输出送入维纳滤波器进行噪声抵消。具体过程如下：

(1)对每帧信号计算短时帧能量：

(2)将四元麦克风阵列中一个通道设置为主通道，其余通道为辅助通道，基于鼾声帧数据通过自适应滤波方法估计主通道与辅助通道接收信号间的时延。令主通道编号为1，n时刻输入信号表示为x₁(n)。其余通道编号为2、3、4，第i(i＝2,3,4)通道n时刻输入信号表示为x_i(n)。将x_i(n)通过一个2k+1阶的FIR滤波器，自适应调整滤波器权值使输出信号最大程度上接近x₁(n)，其中k的取值基于最大可能时延d_1i/c，d_1i为阵元1与阵元i之间的距离，c为声速，本实施例中k取值为32。滤波器的权值根据最小均方算法自适应估计得到，对其进行峰值检测，令峰值对应横坐标为z_i，通道i与主通道信号之间的时延采样点数即为λ_i＝z_i-k；

(3)对辅助通道信号进行时延补偿后，得到和、差两个通道信号。

和通道信号为将主通道信号与时延补偿后的辅助通道信号相加并求平均，噪声信号因非同相叠加得到一定抑制，输出信号中包含期望信号和残留噪声，可将其作为参考信号：

差通道信号为将主通道信号与时延补偿后的辅助通道信号分别相减并构成3维向量，输出信号中鼾声信号被消除，仅保留噪声信号，可将其作为噪声参考信号：

x(n)＝[x₁(n)-x₂(n-λ₂),x₁(n)-x₃(n-λ₃),x₁(n)-x₃(n-λ₃)]^T

其中上标T表示转置；

(4)将和通道信号作为维纳滤波器的主通道信号，差通道信号作为辅助通道信号，通过自适应算法调整维纳滤波器权值从而对差通道的噪声参考信号进行最优估计，随后将主通道信号减去噪声估计信号以实现噪声相消。滤波器权值通过块自适应算法进行更新。假设每个数据块由K个快拍数据构成，利用第p个数据块估计差通道信号的协方差矩阵为：

和通道信号与差通道信号的互相关向量为：

根据维纳-霍夫方程求取维纳滤波器最优的估计权值为：

为避免鼾声信号相消，滤波器权值仅在噪声帧中更新。经维纳滤波器的噪声相消后输出的较为纯净的鼾声信号可表示为：

步骤3、在得到的已增强鼾声数据中提取出鼾声片段。图2为7种来源鼾声片段的典型时频谱图，可看出不同来源的鼾声信号在频域能量分布上有一定区别，因此针对每个鼾声片段提取可描述鼾声谱能量变化信息的梯度方向直方图特征，然后通过多线性主成分分析算法进行特征压缩，提高运行效率。具体内容为：

(1)根据上述步骤2增强处理后的鼾声数据信号，将连续的鼾声帧作为一个鼾声片段，由此获得若干个鼾声片段；

(2)对鼾声片段进行短时傅里叶变换得到时频谱图，第j个鼾声片段的时频谱图为：

SP_j＝[sp(1),sp(2),…,sp(l),…,sp(L)]

式中，L表示帧数，第l帧(1≤l≤L)频域向量为：

sp(l)＝[|S(0,l)|,|S(1,l)|,…,|S(f,l)|,…,|S(N/2-1,l)|]^T

其中，上上标T表示转置，S(f,l)表示在时频点(f,l)处的短时傅里叶变换结果，0≤f≤N/2-1，N为每帧信号进行快速傅里叶变换的点数，f为频率序号。本实施例中N为512点，因此谱图尺寸为256×L；

(3)采用最邻近插值算法将所有鼾声片段谱图的尺寸L统一调整为64；

(4)提取梯度方向直方图特征。首先计算谱图中每个时频点的梯度，然后将谱图划分为小的单元，统计单元中所有时频点的梯度方向构成该单元的梯度方向直方图特征。将相邻的单元组合成大的区域，每个区域的特征向量由该区域内所有单元的特征拼接并经归一化处理得到。最终获得的特征由该谱图中所有区域的特征向量组合而成。本实施例中每个单元包含8×8个时频点，统计梯度方向时将方向区间平均划分成9个直方图通道，因此可得到一个9维的特征向量。每个区域由2×2个单元构成，相邻区域之间重叠50％，最终对于第j个鼾声片段可得到一个31×7×36的特征张量，记为X_j。

(5)通过多线性主成分分析算法进行特征降维。在尽可能保留特征信息的前提下将得到的特征张量从原张量空间投影至低维空间，公式为：

Y_j＝X_j×₁U^(1)T×₂U^(2)T×₃U^(3)T

式中，Y_j为第j个片段经投影后的低维特征张量，U⁽ⁿ⁾(1≤n≤3)为投影矩阵，其值以Y_j散度最大为条件迭代求解得到，X×_nU为张量X与矩阵U的模n积，T为转置。因投影后张量中的特征元素相互独立，可进一步选择其中分类能力较强的若干个特征元素构成最终的特征向量，其中分类能力定义为类间散度和类内散度的比值。针对大量实测数据的实验研究显示，压缩梯度方向直方图特征维度为120时可获得较好的分类性能。

步骤4、根据提取出的压缩梯度方向直方图特征，采用基于“one-versus-one”策略构造多分类支持向量机以实现鼾声来源分类。本实施例中采用LIBSVM工具箱，选用径向基核函数，并采用自动寻优方式设置惩罚因子c和核参数g，最终对应参数为c＝4，g＝0.125。分类性能通过平均分类正确率CA、查准率precision、查全率recall、F1度量等评价指标进行评估，定义分别如下：

式中，N_T表示测试样本总个数，N_C表示分类正确的测试样本总个数，TP(TruePositive)和FP(False Positive)分别表示测试集中该类所有正例被正确和错误分类的数目，而FN(False Negative)则指测试集中该类所有负例被错误分类的数目。

实施例进行了100次鼾声来源分类实验，每次实验采用无放回方式从每类鼾声中随机抽取60％样本(实验中每个片段对应特征向量称为一个样本)作为总体训练集，余下每类40％样本共同组成总体测试集，并对测试集的分类结果进行性能评估。实验显示100次实验获得的平均分类正确率为89.8％，同时下表1给出了7类来源鼾声各自的平均查准率、查全率以及F1度量结果，由表中结果可知，除软腭和咽侧壁共同振动来源的鼾声平均查准率、查全率以及F1度量在83％-86％之间以外，其余6类鼾声的各项指标均不低于88％。综合总体分类性能和每类鼾声的分类性能，可证明本发明方法性能良好，适用于实际情况中鼾症患者鼾声来源的确定问题。

表1 100次鼾声来源分类实验中各类平均查准率、查全率以及F1度量

本发明的方法以麦克风阵列采集的鼾声数据为基础，采用自适应鼾声增强方法抑制数据中的环境噪声，并针对鼾声片段谱图提取可用于描述鼾声谱能量变化信息的压缩梯度方向直方图特征，最后基于支持向量机分类器进行鼾声来源分类。通过本发明的方法，可以利用鼾声信号确定鼾症患者的鼾声来源，对于鼾症治疗方案的选择具有重要的医学价值。

Claims

1.一种鼾声来源分类方法，其特征在于，包括以下步骤：

步骤1、采集鼾声数据信号并进行预处理；

步骤2、对预处理后的鼾声数据信号进行自适应增强处理；

2.根据权利要求1所述的鼾声来源分类方法，其特征在于，步骤1所述采集鼾声数据信号并进行预处理，具体为：

3.根据权利要求2所述的鼾声来源分类方法，其特征在于，步骤2所述对预处理后的鼾声数据信号进行自适应增强处理，具体为：

步骤2-1、求取每帧鼾声数据信号的短时能量E(l)：

k＝d_1i/c

式中，d_1i为阵元1与阵元i之间的距离，c为声速；

和通道信号为将主通道信号与时延补偿后的辅助通道信号相加并求平均，将其作为参考信号d(n)：

差通道信号为将主通道信号与时延补偿后的辅助通道信号分别相减并构成N-1维向量，将其作为噪声参考信号x(n)：

x(n)＝[x₁(n)-x₂(n-λ₂),x₁(n)-x₃(n-λ₃),…,x₁(n)-x_N(n-λ_N)]^T

式中，上标T表示转置；

4.根据权利要求3所述的鼾声来源分类方法，其特征在于，步骤2-2-1所述自适应算法为最小均方算法。

5.根据权利要求3所述的鼾声来源分类方法，其特征在于，步骤2-4-1所述自适应算法采用块自适应算法；通过块自适应算法调整维纳滤波器权值对差通道信号进行最优估计，获得维纳滤波器最优的估计权值具体为：

步骤2-4-1-2、求取和通道信号与差通道信号的互相关向量为：

6.根据权利要求4或5所述的鼾声来源分类方法，其特征在于，步骤3所述根据步骤2增强处理后的鼾声数据信号获取若干个鼾声片段，对每个鼾声片段提取压缩梯度方向直方图特征，具体为：

SP_j＝[sp(1),sp(2),…,sp(l),…,sp(L)]

式中，L表示帧数，第l帧频域向量为：

sp(l)＝[|S(0,l)|,|S(1,l)|,…,|S(f,l)|,…,|S(N/2-1,l)|]^T

7.根据权利要求6所述的鼾声来源分类方法，其特征在于，步骤3-3中所述差值算法具体为最近邻插值法。

8.根据权利要求6或7所述的鼾声来源分类方法，其特征在于，步骤3-4所述基于鼾声片段时频谱图，提取每个鼾声片段的梯度方向直方图特征，具体为：

9.根据权利要求1所述的鼾声来源分类方法，其特征在于，步骤4所述对该鼾声片段进行鼾声来源分类，具体是采用支持向量机分类器对鼾声来源进行分类。

10.根据权利要求9所述的鼾声来源分类方法，其特征在于，步骤4所述基于步骤3提取的鼾声片段对应的压缩梯度方向直方图特征，对该鼾声片段进行鼾声来源分类，具体为：

步骤4-3、将测试集中每个鼾声片段的压缩梯度方向直方图特征输入步骤4-2构造的分类模型中即获取该鼾声片段的来源类别，所述鼾声片段的来源类别包括单软腭振动，单咽侧壁振动，单舌根/会厌振动，软腭和咽侧壁共同振动，软腭和舌根/会厌共同振动，软腭、咽侧壁、舌根/会厌共同振动以及无明显组织振动。