CN111933181A - 基于复数阶导数处理的鼾声特征提取、检测方法及其装置 - Google Patents

基于复数阶导数处理的鼾声特征提取、检测方法及其装置 Download PDF

Info

Publication number
CN111933181A
CN111933181A CN202010663184.5A CN202010663184A CN111933181A CN 111933181 A CN111933181 A CN 111933181A CN 202010663184 A CN202010663184 A CN 202010663184A CN 111933181 A CN111933181 A CN 111933181A
Authority
CN
China
Prior art keywords
snore
complex
derivative
audio signal
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010663184.5A
Other languages
English (en)
Other versions
CN111933181B (zh
Inventor
赵江波
王晓东
李�杰
周勇
钟惠波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202010663184.5A priority Critical patent/CN111933181B/zh
Publication of CN111933181A publication Critical patent/CN111933181A/zh
Application granted granted Critical
Publication of CN111933181B publication Critical patent/CN111933181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于复数阶导数处理的鼾声特征提取和检测方法,步骤A、获取待检测音频信号的复数阶导数;步骤B、利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,从待检测音频信号的复数阶导数中提取鼾声鉴别特征值;步骤C、判断鼾声鉴别特征值是否在所设阈值范围内;如果是,则判定为鼾声,反之则不是鼾声。本发明还提供了一种基于复数阶导数处理的鼾声特征提取和检测装置,以及一种基于复数阶导数处理的鼾声特征提取方法。本发明提取的鼾声特征与其它声音特征有明显区别,提高了鼾声检测的准确度,降低了算法的复杂性。

Description

基于复数阶导数处理的鼾声特征提取、检测方法及其装置
技术领域
本发明涉及信号处理及声音检测领域,尤其涉及一种基于复数阶导数处理的鼾声特征提取方法、检测方法及其装置。
背景技术
在日常生活中,打鼾是一种十分普遍的现象,据有关组织的不完全统计,大约有20%~40%的人群患有打鼾症状。打鼾严重的人会患有阻塞性睡眠呼吸暂停综合征,该病患病率高,严重影响人体健康。为此,研究者们提出了许多止鼾或缓解打鼾的设备,而识别鼾声是各种止鼾或缓解打鼾设备的前提。
现有的鼾声识别方法中,主要可以概括为以下两步。先是对鼾声信号进行处理得到鼾声的特征,然后基于鼾声特征再加以算法实现鼾声识别。例如对音频信号进行处理得到信号的梅尔频率倒谱系数,然后再通过支持向量机来识别是否为鼾声。又如计算音鼾声号的分贝值、周期性等特征,再设置阈值来识别鼾声。可见对鼾声信号进行处理是鼾声识别的关键,现有的鼾声处理方法主要是借鉴语音处理的方法,主要包括时域和频域上的处理,时域上的处理包括提取鼾声的响度、周期性等特征,频域上的处理包括提取基频、熵谱等特征。由于使用现有的鼾声处理方法得到的鼾声特征与其它声音信号区别不明显,使得鼾声识别算法变得复杂且识别率不高、硬件成本增加,不能广泛的应用到民用产品中。
因此,一种能够得到与其它声音特征有明显区别的鼾声处理方法以及设计一种简便、准确率高的鼾声检测方法变得十分重要。
发明内容
有鉴于此,本发明提供了一种基于复数阶导数处理的鼾声特征提取方法、检测方法及其装置,使得提取的鼾声特征与其它声音特征有明显区别,提高了鼾声检测的准确度,降低了算法的复杂性。
为了解决上述技术问题,本发明是这样实现的:
一种基于复数阶导数处理的鼾声特征提取和检测方法,包括:
步骤A、获取待检测音频信号的复数阶导数;复数阶导数实部的选取范围为0<α<3,复数阶导数虚部的选取范围为8<β<11;取值时,α值越大,则β值越小;
步骤B、利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,从待检测音频信号的复数阶导数中提取鼾声鉴别特征值;
步骤C、判断鼾声鉴别特征值是否在所设阈值范围内;如果是,则判定为鼾声,反之则不是鼾声。
优选地,所述步骤A包括:
a1、将待检测的音频信号x(t)进行快速傅里叶变换,获得x(t)的复数形式并表示为序列:{Xk},k=0,1,...,(N-1),k表示序列中的第k个元素,N为序列中元素总数;
a2、获得复数序列{Xk},k=0,1,...,(N-1)中每个元素的导数X(α+βi)k
X(α+βi)k=(iωk)α+βiXk
其中,
Figure BDA0002579374250000021
ωk为Xk中提取的角频率;
a3、对序列{X(α+βi)k},k=0,1,...,(N-1)做快速傅里叶逆变换,得到音频信号x(t)的复数阶导数。
优选地,所述步骤B利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点,提取鼾声鉴别特征值时:
所述幅值是指音频信号的复数阶导数的实部幅值绝对值;则所述步骤B计算音频信号的复数阶导数的实部幅值绝对值的平均值,作为所述鼾声鉴别特征值。
优选地,所述步骤B利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点,提取鼾声鉴别特征值时:
所述幅值是指音频信号的复数阶导数在复平面中对应的点与原点的距离;则所述步骤B计算在复平面上经复阶导数处理后的音频信号的实部和虚部所组成的点与复平面原点之间距离的平均值,作为所述鼾声鉴别特征值。
优选地,采用8k的采样率采样音频信号,采样精度为16位;并且每5秒进行一次步骤A~C的鼾声检测判断。
优选地,在执行步骤A之前,进一步对采集的音频信号进行降噪与预加重的预处理。
本发明还提供了一种基于复数阶导数处理的鼾声特征提取和检测装置,包括:
复数阶导数获取模块,用于获取待检测音频信号的复数阶导数;复数阶导数求取中,导数阶数的实部选取范围为0<α<3,导数阶数的虚部选取范围为8<β<11;取值时,α值越大,则β值越小;
鼾声鉴别特征值提取模块,用于利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,从待检测音频信号的复数阶导数中提取鼾声鉴别特征值;
鼾声判断模块,用于判断所述鼾声鉴别特征值是否在所设阈值范围内;如果是,则判定为鼾声,反之则不是鼾声。
优选地,所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点,获取音频信号的复数阶导数的实部幅值绝对值的平均值,作为所述鼾声鉴别特征值。
优选地,所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点,获取音频信号的复数阶导数与复平面原点之间距离的平均值,作为所述鼾声鉴别特征值。
本发明进一步提供了一种基于复数阶导数处理的鼾声特征提取方法,包括:
步骤A、获取音频信号的复数阶导数;该步骤A包括:
a1、将音频信号x(t)进行快速傅里叶变换,获得x(t)的复数形式并表示为序列:{Xk},k=0,1,...,(N-1),k表示序列中的第k个元素,N为序列中元素总数;
a2、获得复数序列{Xk},k=0,1,...,(N-1)中每个元素的导数X(α+βi)k
X(α+βi)k=(iωk)α+βiXk
其中,
Figure BDA0002579374250000041
ωk为Xk中提取的角频率;导数阶数的实部选取范围为0<α<3,导数阶数的虚部选取范围为8<β<11;
a3、对序列{X(α+βi)k},k=0,1,...,(N-1)做快速傅里叶逆变换,得到音频信号x(t)的复数阶导数;α为复数阶导数的实部,β为复数阶导数的虚部;
步骤B、根据音频信号的复数阶导数提取鼾声鉴别特征值。
有益效果:
当导数阶数在一定范围内时,使用复数阶导数对音频信号进行处理后,鼾声在复平面以及时间轴和实轴所在平面与手机音乐、敲击声、说话语音等声音都有非常明显得区别,而且这种区别可以通过阈值的方式进行区别。本发明利用这一特点,从音频信号的复数阶导数中提取鼾声鉴别特征值,通过设阈值的方法,降低了算法的复杂度,提高了鼾声检测的准确度。
附图说明
图1为本发明鼾声检测方法的流程示意图;
图2为经复数阶导数处理后的鼾声示意图;其中,(a)是时域波形图,(b)为声音经复数阶导数处理后的三维图形,(c)为图(b)中的三维图形在时间轴和实轴所在平面的投影,(d)图为图(b)中的三维图形在复平面的投影;
图3为经复数阶导数处理后的手机音乐声示意图;其中,(a)是时域波形图,(b)为声音经复数阶导数处理后的三维图形,(c)为图(b)中的三维图形在时间轴和实轴所在平面的投影,(d)图为图(b)中的三维图形在复平面的投影;
图4为经复数阶导数处理后的敲击声示意图;其中,(a)是时域波形图,(b)为声音经复数阶导数处理后的三维图形,(c)为图(b)中的三维图形在时间轴和实轴所在平面的投影,(d)图为图(b)中的三维图形在复平面的投影;
图5为本发明鼾声检测装置的组成示意图。
具体实施方式
本申请人研究表明,当导数阶数在一定范围内时,使用复数阶导数对鼾声信号进行处理后,鼾声信号在复平面以及时间轴和实轴所在平面与手机音乐、敲击声、说话语音等声音都有非常明显得区别,因此,可将鼾声信号在复平面或时间轴与实轴所在平面的投影特征作为鼾声检测所用到的特征,也可将这一特征用到相应的模式识别领域。
例如当导数阶数z=1+10i时,对音频信号进行复数阶导数处理,获得一系列的效果图。图2为经复数阶导数处理后的鼾声示意图,(a)是鼾声的时域波形图,(b)为经复数阶导数处理后鼾声的三维图形,(c)为(b)图中的三维图形在时间轴和实轴所在平面的投影,(d)图为(b)图中的三维图形在复平面的投影。
为了表现复数阶导数处理的优越性,本发明选取了手机音乐声和敲击声与鼾声信号进行对比。图3和图4分别展示了手机音乐和敲击声的时域波形图、经复数阶导数处理后的三维图形以及它们各自的三维图形在时间轴和实轴所在平面与复平面上的投影。从图中可以看出,经复数阶导数处理后的音频信号呈现出一种“圆柱”形,直观上看,鼾声信号的三维图形更“粗”些。为了得到更直观的表现,将三维图形在时间轴与实轴所在平面、复平面进行投影。明显的看到,在时间轴与实轴所在的平面,鼾声信号的幅值明显高于其它两种声音。在复平面上的投影呈现一种类“圆”形,鼾声信号的“直径”或“面积”明显大于另外两种声音。
从上图可以看出,通过利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,可以借助阈值的判断方式进行鼾声鉴别。因此,本发明方法的基本过程为:
步骤A、获取待检测音频信号的复数阶导数。
步骤B、利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,从待检测音频信号的复数阶导数中提取鼾声鉴别特征值。
步骤C、判断鼾声鉴别特征值是否在所设阈值范围内;如果是,则判定为鼾声,反之则不是鼾声。
下面结合附图并举实施例,对本发明进行详细描述。
实施例一
本实施例利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点进行特征提取和鼾声检测。
参见图2、3、4中的(c),鼾声、手机音乐声和敲击声在时间轴与实轴所在平面的投影上,图形的粗细不同,也就是幅值不同。那么,本实施例的幅值就是指音频信号的复数阶导数在时间轴与实轴所在平面的投影中距离时间轴的距离,即复数阶导数的实部幅值绝对值。为了衡量该数据的大小,采用音频信号的复数阶导数的实部幅值绝对值的平均值作为所述鼾声鉴别特征值,将其与阈值范围进行比较,以判定是否为鼾声。
基于上述分析,本发明首先用复数阶导数对待检测的音频信号进行处理,然后计算得到处理后的音频信号的实部幅值绝对值平均值,作为鼾声鉴别特征值;然后判断该平均值是否在所设阈值范围内,如果在,则认为是鼾声,反之则不是。
图1给出了本发明实施例一的鼾声检测方法的流程图。如图1所示,本发明所述的鼾声检测方法的实施包括以下步骤:
步骤S110、采集音频信号:
由于鼾声信号的能量大多分布在4kHz以内,且鼾声信号具有准周期性的特点,本实施例在获取音频信号时采用8k的采样率,采样精度为16位,且每5秒进行一次鼾声检测判断。
步骤S120、对采集的音频信号进行预处理:
预处理包括对采集的音频信号进行降噪与预加重的处理。降噪本实施例采用基本谱减法进行降噪,预加重是采用一阶的高通滤波器。降噪与预加重是语音处理中常见的预处理方法,这里不做过多的累述。
步骤S130、利用复数阶导数对音频信号进行处理:
现有的鼾声处理方法主要借鉴语音处理的方法,得到的鼾声特征与其它声音区分不明显,为此,本发明提出使用复数阶导数对鼾声信号进行处理。
(1)复数阶导数的定义如下:
对于函数x(t):
x(t)=Xeiωt (1)
其中,ω与X是常数,且0<ω∈R,X∈R,R表示实数集,t是实变量,
Figure BDA0002579374250000081
那么,x(t)的复数阶导数x(z)可表示为:
x(z)=x(α+βi)=(iω)α+βiXeiωt (2)
其中,z=α+βi,α,β∈R。对于式(2),通常称之为分数阶导数。但是显然,称之为复数阶导数更符合逻辑。
(2)对于一组声音时域信号x(t)进行复数阶导数处理的简单方法如下:
a1、首先对待检测的音频信号x(t)进行快速傅里叶变换(FFT),这样可以得到如式(1)所示的复数形式Xeiωt,Xeiωt的序列表示为:{Xk},k=0,1,...,(N-1),k表示序列中的第k个元素,N为快速傅里叶变换后序列中的元素总数。
a2、获得复数序列{Xk},k=0,1,...,(N-1)中每个元素的导数X(α+βi)k
X(α+βi)k=(iωk)α+βiXk (3)
其中,k表示第k个元素;ωk为Xk中提取的角频率;
a3、对序列{X(α+βi)k},k=0,1,...,(N-1)做快速傅里叶逆变换(IFFT),得到音频信号x(t)的复数阶导数x(z)(t),假设得到最后的时域序列表示为:{Yk},k=0,1,...,(N-1)。
本申请人研究表明,导数阶数z只有在一定范围内时,才能取得良好的效果,其中,实部0<α<3且虚部8<β<11时判别效果较好。取值时,当α取较大的值时,β应取较小的值;当α取较小的值时,β应取较大的值。图2-图4是导数阶数z=1+10i得到的效果图。
步骤S140、计算经复数阶导数处理后的音频数据的实部平均值:
当导数阶数z=1+10i时。假设经复数阶导数处理后所得的时域序列为{Yk},k=0,1,...,(N-1),序列长度为L。那么,实部平均值G可表示为:
Figure BDA0002579374250000082
上式中,当复阶导数的阶数为z=1+10i时,经复阶导数处理后的音频数据为106的倍数,为了方便计算以及方便设置阈值,所以除以106
步骤S150、判断所得平均值G是否在所设阈值范围内:
当导数阶数z=1+10i时,经复数阶导数处理后,鼾声的实部平均值G一般在0.5~0.7之间,而手机音乐声、敲击声等在0.1~0.3之间。因此,当所述音频信号的实部均值G在0.5~0.7之间(包括端点值)时,则认为是鼾声,否则,则认为不是鼾声。
为了实现上述方法,本实施例还提出了一种鼾声检测装置,如图5所示,该鼾声检测装置包括:
复数阶导数获取模块,用于获取待检测音频信号的复数阶导数;复数阶导数求取中,实部阶数的选取范围为0<α<3,虚部阶数选取范围为8<β<11;取值时,α值越大,则β值越小。
鼾声鉴别特征值提取模块,用于利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,从待检测音频信号的复数阶导数中提取鼾声鉴别特征值。本实施例中,该模块获取音频信号的复数阶导数的实部幅值绝对值的平均值,作为所述鼾声鉴别特征值。
鼾声判断模块,用于判断所述鼾声鉴别特征值是否在所设阈值范围内;如果是,则判定为鼾声,反之则不是。
实施例二
本实施例利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点进行特征提取和鼾声检测。参见图2、3、4中的(d),鼾声、手机音乐声和敲击声在复平面的投影上,图的大小不同,该圆的大小可以采用圆形半径来衡量。而圆形半径可以采用信号幅值来计算。对于复平面,信号幅值可以看做是复平面上的点与复平面原点之间的距离。那么,本实施例可以计算在复平面上经复阶导数处理后的音频信号的实部和虚部所组成的点与复平面原点之间距离的平均值,作为所述鼾声鉴别特征值。
本实施例的具体实施步骤与实施例一相同,只是步骤S140的鼾声鉴别特征值的获取方式不同,以及步骤S150所使用的阈值范围不同。
本实施例二的步骤S140在获取鼾声鉴别特征值时,当复数阶导数阶数为z=1+10i时,假设经复数阶导数处理后所得的时域序列为{Yk},k=0,1,...,(N-1),序列长度为L。那么,本实施例中距离的平均值Q可表示为:
Figure BDA0002579374250000101
本实施例二的步骤S150为:判断所得平均值Q是否在所设阈值范围内
本申请人研究发现,经复数阶导数处理后,鼾声的距离平均值Q一般在0.61~1.1之间,而手机音乐声、敲击声等在0.2~0.5之间。因此,当所述音频信号的距离均值Q在0.61~1.1之间(包括端点值)时,则认为是鼾声,否则,则认为不是鼾声。
同理,对于鼾声检测装置,鼾声鉴别特征值提取模块的鼾声鉴别特征值的获取方式与实施例一不同,鼾声判断模块所使用的阈值范围与实施例一不同。
实施例三
本发明还提供了一种基于复数阶导数处理的鼾声特征提取方法,包括如下步骤:
步骤A、获取音频信号的复数阶导数;该步骤A包括:
a1、将音频信号x(t)进行快速傅里叶变换,获得x(t)的复数形式并表示为序列:{Xk},k=0,1,...,(N-1),k表示序列中的第k个元素,N为序列中元素总数;
a2、获得复数序列{Xk},k=0,1,...,(N-1)中每个元素的导数X(α+βi)k
X(α+βi)k=(iωk)α+βiXk
其中,
Figure BDA0002579374250000111
ωk为Xk中提取的角频率;导数阶数的实部选取范围为0<α<3,导数阶数的虚部选取范围为8<β<11;
a3、对序列{X(α+βi)k},k=0,1,...,(N-1)做快速傅里叶逆变换,得到音频信号x(t)的复数阶导数;α为复数阶导数的实部,β为复数阶导数的虚部;
步骤B、根据音频信号的复数阶导数提取鼾声鉴别特征值。
采用该方法提取出的鼾声鉴别特征值不仅可以用于本发明的鼾声检测过程,还可以用于其他模式识别过程,例如可以作为神经网络的部分输入特征,用以实现与其他声音的区别。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于复数阶导数处理的鼾声特征提取和检测方法,其特征在于,包括:
步骤A、获取待检测音频信号的复数阶导数;复数阶导数实部的选取范围为0<α<3,复数阶导数虚部的选取范围为8<β<11;取值时,α值越大,则β值越小;
步骤B、利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,从待检测音频信号的复数阶导数中提取鼾声鉴别特征值;
步骤C、判断鼾声鉴别特征值是否在所设阈值范围内;如果是,则判定为鼾声,反之则不是鼾声。
2.如权利要求1所述的方法,其特征在于,所述步骤A包括:
a1、将待检测的音频信号x(t)进行快速傅里叶变换,获得x(t)的复数形式并表示为序列:{Xk},k=0,1,...,(N-1),k表示序列中的第k个元素,N为序列中元素总数;
a2、获得复数序列{Xk},k=0,1,...,(N-1)中每个元素的导数X(α+βi)k
X(α+βi)k=(iωk)α+βiXk
其中,
Figure FDA0002579374240000011
ωk为Xk中提取的角频率;
a3、对序列{X(α+βi)k},k=0,1,...,(N-1)做快速傅里叶逆变换,得到音频信号x(t)的复数阶导数。
3.如权利要求1所述的方法,其特征在于,所述步骤B利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点,提取鼾声鉴别特征值时:
所述幅值是指音频信号的复数阶导数的实部幅值绝对值;则所述步骤B计算音频信号的复数阶导数的实部幅值绝对值的平均值,作为所述鼾声鉴别特征值。
4.如权利要求1所述的方法,其特征在于,所述步骤B利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点,提取鼾声鉴别特征值时:
所述幅值是指音频信号的复数阶导数在复平面中对应的点与原点的距离;则所述步骤B计算在复平面上经复阶导数处理后的音频信号的实部和虚部所组成的点与复平面原点之间距离的平均值,作为所述鼾声鉴别特征值。
5.如权利要求1所述的方法,其特征在于,采用8k的采样率采样音频信号,采样精度为16位;并且每5秒进行一次步骤A~C的鼾声检测判断。
6.如权利要求1所述的方法,其特征在于,在执行步骤A之前,进一步对采集的音频信号进行降噪与预加重的预处理。
7.一种基于复数阶导数处理的鼾声特征提取和检测装置,其特征在于,包括:
复数阶导数获取模块,用于获取待检测音频信号的复数阶导数;复数阶导数求取中,导数阶数的实部选取范围为0<α<3,导数阶数的虚部选取范围为8<β<11;取值时,α值越大,则β值越小;
鼾声鉴别特征值提取模块,用于利用鼾声信号的复数阶导数在时间轴与实轴所在平面或复平面的投影在幅值上与其它声音有显著区别的特点,从待检测音频信号的复数阶导数中提取鼾声鉴别特征值;
鼾声判断模块,用于判断所述鼾声鉴别特征值是否在所设阈值范围内;如果是,则判定为鼾声,反之则不是鼾声。
8.如权利要求7所述的装置,其特征在于,所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在时间轴与实轴所在平面的投影在幅值上与其它声音有显著区别的特点,获取音频信号的复数阶导数的实部幅值绝对值的平均值,作为所述鼾声鉴别特征值。
9.如权利要求7所述的装置,其特征在于,所述鼾声鉴别特征值提取模块利用鼾声信号的复数阶导数在复平面的投影在幅值上与其它声音有显著区别的特点,获取音频信号的复数阶导数与复平面原点之间距离的平均值,作为所述鼾声鉴别特征值。
10.一种基于复数阶导数处理的鼾声特征提取方法,其特征在于,包括:
步骤A、获取音频信号的复数阶导数;该步骤A包括:
a1、将音频信号x(t)进行快速傅里叶变换,获得x(t)的复数形式并表示为序列:{Xk},k=0,1,...,(N-1),k表示序列中的第k个元素,N为序列中元素总数;
a2、获得复数序列{Xk},k=0,1,...,(N-1)中每个元素的导数X(α+βi)k
X(α+βi)k=(iωk)α+βiXk
其中,
Figure FDA0002579374240000031
ωk为Xk中提取的角频率;导数阶数的实部选取范围为0<α<3,导数阶数的虚部选取范围为8<β<11;
a3、对序列{X(α+βi)k},k=0,1,...,(N-1)做快速傅里叶逆变换,得到音频信号x(t)的复数阶导数;α为复数阶导数的实部,β为复数阶导数的虚部;
步骤B、根据音频信号的复数阶导数提取鼾声鉴别特征值。
CN202010663184.5A 2020-07-10 2020-07-10 基于复数阶导数处理的鼾声特征提取、检测方法及其装置 Active CN111933181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010663184.5A CN111933181B (zh) 2020-07-10 2020-07-10 基于复数阶导数处理的鼾声特征提取、检测方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010663184.5A CN111933181B (zh) 2020-07-10 2020-07-10 基于复数阶导数处理的鼾声特征提取、检测方法及其装置

Publications (2)

Publication Number Publication Date
CN111933181A true CN111933181A (zh) 2020-11-13
CN111933181B CN111933181B (zh) 2022-05-17

Family

ID=73313729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010663184.5A Active CN111933181B (zh) 2020-07-10 2020-07-10 基于复数阶导数处理的鼾声特征提取、检测方法及其装置

Country Status (1)

Country Link
CN (1) CN111933181B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419977A (zh) * 2011-01-14 2012-04-18 展讯通信(上海)有限公司 瞬态音频信号的判别方法
WO2016126147A1 (ko) * 2015-02-06 2016-08-11 아주대학교 산학협력단 코골이 검출 장치 및 방법
US20160270720A1 (en) * 2013-11-22 2016-09-22 Shenzhen Vvfly Electronics Co. Ltd. Electronic snore-ceasing device and method for snore-ceasing
CN106691382A (zh) * 2016-12-26 2017-05-24 赛博龙科技(北京)有限公司 一种基于时频相似性的鼾声检测方法及装置
CN106725337A (zh) * 2017-01-05 2017-05-31 北京怡和嘉业医疗科技股份有限公司 鼾声检测方法和装置、正压呼吸机
CN109350014A (zh) * 2018-12-10 2019-02-19 苏州小蓝医疗科技有限公司 一种鼾声识别方法与系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419977A (zh) * 2011-01-14 2012-04-18 展讯通信(上海)有限公司 瞬态音频信号的判别方法
US20160270720A1 (en) * 2013-11-22 2016-09-22 Shenzhen Vvfly Electronics Co. Ltd. Electronic snore-ceasing device and method for snore-ceasing
WO2016126147A1 (ko) * 2015-02-06 2016-08-11 아주대학교 산학협력단 코골이 검출 장치 및 방법
CN106691382A (zh) * 2016-12-26 2017-05-24 赛博龙科技(北京)有限公司 一种基于时频相似性的鼾声检测方法及装置
CN106725337A (zh) * 2017-01-05 2017-05-31 北京怡和嘉业医疗科技股份有限公司 鼾声检测方法和装置、正压呼吸机
CN109350014A (zh) * 2018-12-10 2019-02-19 苏州小蓝医疗科技有限公司 一种鼾声识别方法与系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
侯丽敏 等: "鼾声的基频分布与SAHS的关联性", 《声学技术》 *

Also Published As

Publication number Publication date
CN111933181B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN106935248B (zh) 一种语音相似度检测方法及装置
CN108896878B (zh) 一种基于超声波的局部放电检测方法
CN110570880B (zh) 一种鼾声信号识别方法
CN107610715B (zh) 一种基于多种声音特征的相似度计算方法
JP4272050B2 (ja) オーディトリーイベントに基づく特徴付けを使ったオーディオの比較
CN102054480B (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN104887263B (zh) 一种基于心音多维特征提取的身份识别算法及其系统
Lin et al. Automatic wheezing detection using speech recognition technique
US20030088401A1 (en) Methods and apparatus for pitch determination
CN110970042A (zh) 一种电子听诊器的肺部啰音人工智能实时分类方法、系统、装置及可读存储介质
CN110942784A (zh) 基于支持向量机的鼾声分类系统
CN111415644B (zh) 一种音频舒缓度预测方法及装置、服务器、存储介质
CN103297590B (zh) 一种基于音频实现设备解锁的方法和系统
CN105662454B (zh) 一种罗音检测的方法和装置
CN112820319A (zh) 一种人类鼾声识别方法及其装置
CN112466276A (zh) 一种语音合成系统训练方法、装置以及可读存储介质
CN111613210A (zh) 一种各类呼吸暂停综合征的分类检测系统
CN111933181B (zh) 基于复数阶导数处理的鼾声特征提取、检测方法及其装置
Akdeniz et al. Linear prediction coefficients based copy-move forgery detection in audio signal
Porieva et al. Investigation of lung sounds features for detection of bronchitis and COPD using machine learning methods
González-Martínez et al. Improving snore detection under limited dataset through harmonic/percussive source separation and convolutional neural networks
CN104605886B (zh) 喘鸣音检测装置和方法
CN110179492B (zh) 基于自适应双阈值的肠鸣音智能识别算法
Ihza et al. Study of Denoising Method to Detect Valvular Heart Disease Using Phonocardiogram (PCG)
CN110634504B (zh) 一种鼾声检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant