CN103093759A - 一种基于移动终端的嗓音检测评估装置及方法 - Google Patents

一种基于移动终端的嗓音检测评估装置及方法 Download PDF

Info

Publication number
CN103093759A
CN103093759A CN2013100161066A CN201310016106A CN103093759A CN 103093759 A CN103093759 A CN 103093759A CN 2013100161066 A CN2013100161066 A CN 2013100161066A CN 201310016106 A CN201310016106 A CN 201310016106A CN 103093759 A CN103093759 A CN 103093759A
Authority
CN
China
Prior art keywords
voice
signal
sound signal
module
voice sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100161066A
Other languages
English (en)
Other versions
CN103093759B (zh
Inventor
徐礼胜
边钺岩
王娇娜
汪威
靳雁冰
纪朋飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201310016106.6A priority Critical patent/CN103093759B/zh
Publication of CN103093759A publication Critical patent/CN103093759A/zh
Application granted granted Critical
Publication of CN103093759B publication Critical patent/CN103093759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

一种基于移动终端的嗓音检测评估装置,包括嗓音检测评估终端,其包括信号采集及数据保存单元、嗓音信号处理及评估单元和数据输出单元;嗓音检测评估终端采用移动终端;信号采集及数据保存单元包括嗓音信号采集模块、嗓音信号数据保存模块和检测评估结果保存模块;嗓音信号处理及评估单元包括嗓音信号处理模块、嗓音信号周期检测模块、特征参数提取模块和嗓音信号特征评估分析模块;数据输出单元包括嗓音信号输出模块、嗓音信号波形绘制模块和检测日志访问模块。本发明具有嗓音信号采集、处理、分析和评估功能,基于移动终端的嗓音检测评估装置具有便携、低成本、性别差异不敏感等优点。

Description

一种基于移动终端的嗓音检测评估装置及方法
技术领域
本发明涉及移动终端和嗓音检测技术领域,具体涉及一种基于移动终端的嗓音检测评估装置及方法。
背景技术
随着医学技术的发展和人们健康意识的提高,人们更加重视嗓音疾病对生活质量造成的影响,嗓音声学评估、喉功能检测、嗓音矫治与保健成为了耳鼻咽喉科新的发展趋势。然而,随着人口老龄化和慢性疾病人口比例的逐年增长,传统的医疗服务面临巨大的压力和挑战。因此,一种便携式、低成本、有效的嗓音分析检测系统亟待出现。
目前,国内外主要使用电子计算机及频谱分析仪采集、分析、统计嗓音声样,对嗓音进行声学分析。国内已有的嗓音医学相关系统为国产USSA语音频谱分析系统(彭策,万柏坤.嗓音分析在疾病诊断中的应用[J].生物医学工程学杂志,2007,24(6):1419-1422.),声样采集均在环境噪音小于45dB SPL的空调室内,受检者口距麦克风10-15cm,自然舒适平稳发元音/a/、/i/各3~5秒各1次,声强控制在80dB SPL左右,通过A/D转换,输入电子计算机进行嗓音声学参数分析,采集的声学参数有:基频(F0)、基频微扰(Jitter)、振幅微扰(Shimmer)、规范化噪声能量(NNE)、基频标准差(SDF0)等。
国外的相关系统有美国Tiger Electronics(上海)公司生产的Dr.Speech Science语音分析系统,法国开发的嗓音工作站EVA(Marseille French)(Hu Ruimin,Peng Jun,Zhu Rong.ElectronicMail Voice Assistant(EVA).High Technology Letters,19981.)和美国Kay Elemetrics公司的多维语音分析系统MDVP(Multi-Dimensional Voice Program)(Kent RD,Vorperian HK,Kent JF,Duffy JR.Voice dysfunction in dysarthria:application of the Multi-Dimensional Voice Program.Journal of communication disorders,20034.;Maryn Y,Corthals P,De Bodt M,Van Cauwenberge P,Deliyski D.Perturbation measures of voice:a comparative study between Multi-Dimensional VoiceProgram and Praat.Folia phoniatrica et logopaedica,20094.),以上提及的这些软件的采样环境与上述国产的系统基本相同,处理结果和参数分析较优于国产系统。多维语音嗓音分析软件的主要功能是研究正常嗓音和病变嗓音的声学性质,能从语音信号中提取包括频率抖动、振幅抖动、基频、能量等32项声学参数,利用这些参数可以评价嗓音的特性,同时可以利用各参数的正常参考值对病变嗓音进行临床分析。
但上述系统、软件价格昂贵,且受于时间和环境的限制,不能随时随地方便快捷对嗓音信号进行分析评估,适用人群非常少,在国内外尚未得到普及。
如今移动终端(如手机、掌上电脑等)已经发展的十分迅速,计算速度和能力非常惊人,且得到很大范围的普及,需对嗓音进行评估的人群日益增加(教师、音乐人等),但是基于移动终端的嗓音评估系统尚属空白。此外,由于嗓音信号的多变性,迄今尚未找到一种完善的方法可以使各类人群、各种环境条件下都能获得满意的检测结果,也缺少对性别差异等的考虑。
目前已有一些针对嗓音分析或者性能评估的专利,但是其中有的是针对特定人群对嗓音性能进行评估(德米特里·戈洛夫金,崔哲珉.评估演唱者的嗓音性能的方法和使用该方法的设备.CN101740025A_200910.),有的是提供一种嗓音谐噪比的分析方法(颜永红,王迪,张建平.一种自动嗓音谐噪比分析方法.CN101452698_200710.),有的几乎未涉及嗓音生理参数(KAY ELEMETRICS CORP.Speech analysis apparatus.US23732081A_1981-2-23.),都缺少可以适用于各类人群比较便捷并且可以对重要生理参数进行分析评估的系统。请参见中国专利CN101740025A“评估演唱者的嗓音性能的方法和使用该方法的设备”德米特里·戈洛夫金等人提出的一种用于评估卡拉OK设备的演唱者的嗓音性能的方法;参见中国专利CN101452698“一种自动嗓音谐噪比分析方法”颜永红等人发明的使用自相关图表征的时域和耳蜗谱域通道之间相关性来判断谐波成份进行谐噪比分析的方法;参见美国专利US23732081A“speech analysis apparatus”Harbeson,William D等人发明的将音调频率信号等通过电压传感器到视觉显示装置。
发明内容
针对现有技术存在的问题,本发明提供一种基于移动终端的嗓音检测评估装置及方法。
本发明的技术方案是:
一种基于移动终端的嗓音检测评估装置,包括嗓音检测评估终端,用于对嗓音信号进行检测并分析嗓音状态,其包括信号采集及数据保存单元、嗓音信号处理及评估单元和数据输出单元;
所述嗓音检测评估终端采用移动终端;
所述信号采集及数据保存单元包括嗓音信号采集模块、嗓音信号数据保存模块和检测评估结果保存模块;嗓音信号采集模块用于采集测试者的嗓音信号,采集到的嗓音信号在嗓音信号数据保存模块进行保存,嗓音检测评估结果在检测评估结果保存模块进行保存;
所述嗓音信号处理及评估单元包括嗓音信号处理模块、嗓音信号周期检测模块、特征参数提取模块和嗓音信号特征评估分析模块;
嗓音信号处理模块用于截取嗓音信号中的周期性信号;嗓音信号周期检测模块用于对截取的周期性信号进行周期检测;特征参数提取模块用于对嗓音信号周期检测模块的输出信号进行特征参数提取,特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE;嗓音信号特征评估分析模块用于对特征参数提取模块的提取结果进行分析,得出测试者嗓音状态;
所述数据输出单元包括嗓音信号输出模块、嗓音信号波形绘制模块和检测日志访问模块;
嗓音信号输出模块用于将嗓音信号特征评估分析模块的分析结果输出到外部,嗓音信号波形绘制模块用于将采集到的测试者的嗓音信号绘制成波形并显示,检测日志访问模块用于将特征参数提取模块的提取结果和嗓音信号特征评估分析模块的分析结果生成检测日志,进行长期跟踪分析。
采用上述基于移动终端的嗓音检测评估装置进行嗓音检测评估方法,包括以下步骤:
步骤1:通过嗓音检测评估终端采集测试者的嗓音信号,将所采集到的嗓音数据绘制波形曲线显示并保存数据;
步骤2:截取采集到的嗓音信号中的周期性信号;
截取采集到的嗓音信号中的周期性信号的具体方法如下:
步骤2.1:对采集到的嗓音信号进行小波变换,并得到嗓音信号中高频部分的小波系数;
步骤2.2:对小波变换后的嗓音信号进行分帧,计算分帧后每帧信号的小波系数的偏方差值;
步骤2.3:选取小波系数的偏方差值最小的一帧嗓音信号作为周期性信号并保存;
步骤3:对截取的周期性信号进行周期检测;
步骤3.1:通过快速傅里叶变换确定周期性信号的基频;
人的嗓音频率范围为50-500Hz,测试者嗓音在该频率范围内的最大值位置即为估算的嗓音信号中周期性信号的基频。
通过傅里叶变换确定周期性信号的基频,具体步骤如下:
步骤3.1.1:对周期性信号进行傅里叶变换;
步骤3.1.2:在变换后的周期性信号中选取人的嗓音频率范围内的频率,其中的最大峰值位置作为主峰值;
人的嗓音频率范围为50-500Hz;
步骤3.1.3:提取最大峰值位置的1/N位置处的±5%范围内的峰值即作为分峰值,N为整数,N=1,2,3,4,5……;
步骤3.1.4:判断主峰值与分峰值的比值,若该比值小于10,则该主峰值为基频,否则该主峰值不是基频,返回步骤3.1.3,提取最大峰值位置的1/(N+1)位置处的±5%范围内的峰值即作为分峰值,继续判断主峰值与分峰值的比值;
步骤3.1.5:得到周期性信号的基频;
步骤3.2:采用小波变换的方法对周期性信号进行小波分解和小波重构,得到小波重构信号;
嗓音基频变化范围较大,从低音男性的50Hz到高音女性或儿童的500Hz,接近三个倍频程,根据嗓音信号据估计的基础频率不同,小波分解的层数一般为9层以上(包括9层),小波重构的层数一般为6层或7层。
根据理论和实验分析得出:基础频率约为50-172Hz的嗓音信号应选择在第7层进行小波重构;基础频率约为172-344Hz的嗓音信号应选择在第6层进行小波重构;基础频率约为344-500Hz的嗓音信号应选择在第5层进行小波重构。
步骤3.3:对小波重构信号进行周期检测,得到嗓音信号的周期;
对比较复杂的嗓音信号周期检测即转化为对比较简单的小波重构信号的周期检测,小波重构信号的波形是类正弦曲线,对小波重构信号进行周期检测的步骤如下:
步骤3.3.1:通过导数特性检测得到小波重构信号的峰值位置序列;
步骤3.3.2:去除峰值位置序列中的重复峰值,得到新的峰值位置序列;
步骤3.3.3:检测步骤3.3.2得到的峰值位置序列中的每个点的前后15%的范围内的极大值,得到小波重构信号的极大值位置序列;
采用同样方法,重复步骤3.3.1~步骤3.3.3可得到原始嗓音周期性信号的极大值位置序列;
步骤3.3.4:将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配,完成周期检测;
将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配,具体是:将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列里的数值按顺序进行比对,计算相应位置数值之差,若差值<基本周期的20%(基本周期为基频的倒数),则该数值保留,否则舍弃,得到新的嗓音周期性信号的极大值位置序列就是周期性信号的峰值位置序列,进而得到嗓音信号的周期,完成嗓音信号的周期检测。
步骤4:对周期检测后的嗓音信号进行特征参数提取,并对提取结果进行显示和保存,特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE;
基频(Fundamental Frequency,F0)是声带振动的基础频率,单位为Hz,表示每秒声带振动的次数,是最常用的声学检测指标之一。一般来说,正常男性的基频在130Hz左右,正常女性的基频在250Hz左右,正常儿童的基频在340Hz左右。基频主要是由声带振动的速率决定的。声带振动部分的长度,声带组织的张力以及声带质量的大小是决定基频的三大因素。
微扰分为频率微扰(Jitter)和振幅微扰(Shimmer):基频微扰和振幅微扰主要反映嗓音信号的瞬时变化情况,一般来说,病理嗓音较正常嗓音有更高的基频微扰值和振幅微扰值[8]。嗓音随声带的质量、振动幅度、紧张度而变化,人的嗓音频率与幅度不是衡定不变的,发声时声信号频率与振幅出现微小、快速、不规则的变化,这种变化称之为频率微扰商(FPQ或称Jitter)和振幅微扰商(APQ或称Shimmer),音调微扰与频率的百分比表示频率变动幅度,基本周期平均数除微扰程度得出相对平均微扰。Jitter及Shimmer均表达嗓音信号的短时变化,是反映声带不规律性振动的有效指标,分别反映声音的嘶哑程度及粗糙程度,不同的声样其Shimmer、Jitter不同,发/i/时,声带拉紧,张力较大,通过声门的气流量较发/a/时小,而声门下压则较大,故声带振动相对发/a/时规则,发元音/i/时对Jitter和Shimmer值影响最小,病理状态下更易受代偿影响。
基频微扰(Jitter)是指相邻周期间声波频率的变化率,用于度量指定的一个周期与相邻前几个周期或后几个周期的差异量,反映声带振动周期间频率的差异。
基频微扰有五个计算公式:
Jitter = 100 M - k + 1 Σ n - 1 M - k + 1 | 1 - k * x ( n + m - 1 ) Σ j = 1 k x ( n + j - 1 ) | ( % )
a)基频微扰(RAP)的定义是移动平均数为3
b)基频微扰(PPQ)的定义是移动平均数为5
c)基频微扰(11p)的定义是移动平均数为11
d)基频微扰(abs)的定义是: Jitter ( abs ) = Σ i = 2 M | x ( i ) - x ( i - 1 ) | ( ms )
e)基频微扰(per)的定义是: Jitter ( per ) = Jitter ( abs ) Σ i = 1 M | x ( i ) | M ( % )
x(i)为嗓音信号,k是移动平均长度(k>1,整数),m=(k+1)/2,M是周期数,n是整数;
一般来说,基频微扰的前三种定义更为恰当,因为它们对声带振动时无意识的变化有明显反映。在本发明中,基频微扰(PPQ)是缺省值。
Jitter是用来评价声样中音调的变异率,它表现了相对的周期间(非常短期)的变化程度,表明声带振动的不规律性。
振幅微扰(Shimmer)是描述相邻周期之间声波幅度的变化,可以从测量声波振幅的峰-峰值获得。振幅微扰单位是%,计算公式与基频微扰的相似:
Shimmer = 100 M - k + 1 Σ n - 1 M - k + 1 | 1 - k * x ( n + m - 1 ) Σ j = 1 k x ( n + j - 1 ) | ( % )
a)振幅微扰(3pt)的定义是移动平均数为3
b)振幅微扰(APQ)的定义是移动平均数为5
c)振幅微扰(11p)的定义是移动平均数为11
d)振幅微扰(per)的定义是: Shimmer ( per ) = Shimmer ( abs ) Σ i = 1 M | x ( i ) | M ( % )
x(i)为嗓音信号,k是移动平均长度(k>1,整数),m=(k+1)/2,M是周期数,在本发明中,振幅微扰(APQ)是缺省值。
振幅微扰反映嘶哑声程度,并且主要反映声带振动的稳定性,其值越小,声带振动越稳定,指在发声过程中声学信号出现的微小的、快速的变化。
谐噪比(Hamonics-to-Noise Ratio)是检测病态嗓音和评价嗓音素质的一个客观指标,声音嘶哑的一个客观指标,是谐音成分与噪音成分的比较,谐噪比是谐波能量与噪声能量的比值,对喉部疾病的诊断、治疗效果的判断有重要意义。
信噪比(Signal-to-Noise Ratio):
在本发明中采用加零补齐法提取噪音成分:
一个稳态元音的声波包含有周期性重复的谐波分量和附加噪声成份,其中附加噪声成份具有零均值分布。
信号f(t)可以认为是周期信号fr(t)的连接,又因为噪声具有零均值分布,所以当有足够多的fr(t)在一个周期中叠加,就可以去除噪声成份,余下的就是谐波成份。
平均波 f a ( t ) = ( Σ r = 1 n f r ( t ) ) / n
其中n为基频周期数,r为周期,fr(t)为周期信号,
如Tmax为所有周期中的最大周期,Ti为每个周期的长度,则可设fi(t)=0,Ti<t≤Tmax。即对信号进行补零。
f(t)诣波成份的能量定义为:
Figure BDA00002741454200065
f(t)中噪声成份的能量定义为:
Figure BDA00002741454200066
谐噪比HNR的定义为:HNR=10lg(H/N)
信噪比SNR的定义为:SNR=10lg(S/N)
标准化声门噪声能量NNE主要计算发声时由于声门非完全关闭引起的声门噪声的能量。NNE量反映了发声中由于声门空气泄漏造成的骚动噪声的程度,因此,与嗓音质量的气息声密切相关。声门噪声能量单位是dB,计算公式如下:
NNE = 10 * log &Sigma; n w ( n ) 2 &Sigma; n x ( n ) 2 + BL - - - ( dB )
w(n)代表噪声成分,x(n)代表声学信号,BL为常数,用于补偿滤波器中去除的噪声能量。一般认为,在检测嗓音疾病时,声门噪声能量比谐噪比更灵敏。声门噪声能量在区分病理和正常嗓音是更有效,直接反映了声带的闭合程度。NNE主要反映气息声程度,其次是嘶哑声程度;嘶哑声是气息声和粗糙声的组合。
由以上各个特征值计算方法求得嗓音信号的特征值。
步骤5:对特征参数提取结果和健康嗓音数据的特征参数进行比对分析,得出测试者嗓音状态;
用移动终端采集的病理嗓音数据和健康嗓音数据,并对病理嗓音数据的特征参数和健康嗓音数据的特征参数进行了比对分析。正常人频率微扰0.18±0.07%、振幅微扰1.60±0.74%、谐噪比25.34±3.12dB、信噪比25.39±3.09dB、声门噪声能量-16.95±3.57dB。男性基频平均值160.81±24.27Hz、女性基频平均值297.42±35.89Hz、基频总平均值206.35±70.77Hz。病理嗓音患者上述结果有不同程度的改变。由相关医学知识可知对应特征值发生异常时对应着相关嗓音病例状况,进行病理分析。
步骤6:对分析结果进行显示,并且根据特征参数提取结果和分析结果生成测试者嗓音检测日志,可以根据需要随时查阅。
有益效果:本发明具有嗓音信号采集、处理、分析和评估功能,基于移动终端的嗓音检测评估装置具有便携、低成本、性别差异不敏感等优点,将嗓音信号的采集和分析在移动终端平台下实现,为嗓音常态与病态的鉴别诊断及喉部疾病治疗等病理研究提供客观的定量评价指标,也为喉部疾病治疗的疗效随访和喉科医师及病理学家提供帮助。需要说明的是,本发明的直接目的并不是获得诊断结果或健康状况,而只是从受检者身体获取作为中间结果的信息或生理参数,即检测并分析出嗓音是否处于常态,为后续诊断提供信息。
附图说明
图1是本发明的具体实施方式的基于移动终端的嗓音检测评估装置结构框图;
图2是本发明的具体实施方式的基于移动终端的嗓音检测评估方法流程图;
图3是本发明的具体实施方式的通过傅里叶变换确定周期性信号的基频的流程图;
图4是本发明的具体实施方式的通过导数特性检测得到小波重构信号的峰值位置序列流程图;
图5是本发明的具体实施方式的去除峰值位置序列中的重复峰值流程图;
图6是本发明的具体实施方式的检测得到小波重构信号的极大值位置序列的流程图;
图7是本发明的具体实施方式的小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列模糊匹配流程图;
图8是本发明的具体实施方式的采集到的嗓音数据绘制波形曲线图;
图9是本发明的具体实施方式的小波变换示意图。
具体实施方式
下面结合附图对本发明的具体实施方式做详细说明。
如图1所示,本实施方式的基于移动终端的嗓音检测评估装置,包括嗓音检测评估终端,用于对嗓音信号进行检测并分析嗓音状态,其包括信号采集及数据保存单元、嗓音信号处理及评估单元和数据输出单元;
信号采集及数据保存单元包括嗓音信号采集模块、嗓音信号数据保存模块和检测评估结果保存模块;嗓音信号采集模块用于采集测试者的嗓音信号,采集到的嗓音信号及嗓音检测评估结果分别在嗓音信号数据保存模块和检测评估结果保存模块进行保存;
嗓音信号处理及评估单元包括嗓音信号处理模块、嗓音信号周期检测模块、特征参数提取模块和嗓音信号特征评估分析模块;
嗓音信号处理模块用于截取嗓音信号中的周期性信号;嗓音信号周期检测模块用于对截取的周期性信号进行周期检测;特征参数提取模块用于对嗓音信号周期检测模块的输出信号进行特征参数提取,特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE;嗓音信号特征评估分析模块用于对特征参数提取模块的提取结果进行分析,得出测试者嗓音状态;
数据输出单元包括嗓音信号输出模块、嗓音信号波形绘制模块和检测日志访问模块;
嗓音信号输出模块用于将嗓音信号特征评估分析模块的分析结果输出到外部,嗓音信号波形绘制模块用于将采集到的测试者的嗓音信号绘制成波形并显示,检测日志访问模块用于将特征参数提取模块的提取结果和嗓音信号特征评估分析模块的分析结果生成检测日志,进行长期跟踪分析。
嗓音检测评估终端采用移动终端,本实施方式的移动终端为以Android为平台的智能手机,通过手机的麦克风对原始嗓音信号进行采集,并储存到智能手机中的SQLite数据库中,通过对该数据库中的嗓音信号数据进行处理和检测,提取出特征参数,进而进行嗓音状态的评估分析,并将每次处理的数据和分析结果存入数据库,建立一个基于固定测试者的长期的检测日志,对测试者的嗓音状况进行长期跟踪检测,达到实时监控的目的。
本装置可以以软件装置的形式实现在智能手机平台下。
采用上述基于移动终端的嗓音检测评估装置进行嗓音检测评估方法,流程如图2所示,包括以下步骤:
步骤1:通过嗓音检测评估终端采集测试者的嗓音信号,将所采集到的嗓音数据绘制波形曲线显示并保存数据;
使用智能手机附带的麦克风对嗓音信号收集音样。采样前,背景噪声要求在45dB以下,达到要求后嘱测试者取坐位,测试麦克风置于嘴前10cm,测试者喉头放松,深吸气后,用正常音量自然舒适平稳持续发/a/音达5秒钟,嗓音信号存入指定文件。嗓音信号数据实际为16位PCM数据,保存在文件中的数据为Short型数据值/256得到相应的double型数据值,其范围为[-1,1]。最终写入文件的是double型嗓音数据。
根据采集到的嗓音信号绘制出的波形曲线如图8所示。
步骤2:截取采集到的嗓音信号中的周期性信号;
由于用户录制时会造成一定的延时,导致信号的前半部分不呈现周期性或噪声较大,所以对信号需进行截取,从原始信号中截取到周期性较好的部分进行分析;
截取采集到的嗓音信号中的周期性信号的具体方法如下:
步骤2.1:对采集到的嗓音信号进行小波变换,并得到嗓音信号中高频部分的小波系数;
步骤2.2:对小波变换后的嗓音信号进行分帧,计算分帧后每帧信号的小波系数的偏方差值;
步骤2.3:选取小波系数的偏方差值最小的一帧嗓音信号作为周期性信号并保存;
本实施方式中,具体操作是先对44100个点(1秒)嗓音数据进行小波变换,得到第十层小波系数(信号高频部分的系数),然后将44100个点按8192个点为一帧每隔500个点进行分帧,计算分帧后每帧系数的偏方差值,最后偏方差值最小的一帧认为周期性较好,并将处理后数据进行保存。
步骤3:对截取的周期性信号进行周期检测;
步骤3.1:通过快速傅里叶变换确定周期性信号的基频;
人的声带差异较大,嗓音基频的范围较广,所以需要先估算嗓音信号的基频以确定小波分解层数和小波重构层数。人的嗓音频率范围为50-500Hz,测试者嗓音在该频率范围内的最大值位置即为估算的嗓音信号中周期性信号的基频。
在FFT变换后的信号中,有效信号为频率为正的半部分信号序列,从0Hz开始向正向延伸的序列中,第一次峰值(第一次较大的脉冲)即为嗓音信号的基本频率对应的频率值。人的嗓音频率范围为50-500Hz,测试者嗓音在该频率范围内的最大值位置即为估算的嗓音基频,在一般情况下,嗓音信号的频域变换后的频域信号正向序列的第一次较大脉冲即为嗓音信号的基本频率对应的频率,对嗓音信号的估计基本频率的提取依据嗓音信号在频域内的第一峰值所在位置即可。然而,在对实际病理嗓音的频率分析中,由于各种因素的影响,嗓音信号的频域变换后,最峰值并不对应着嗓音信号的估计基本频率,而是基本频率的整数倍。这种情况,在频域分析中是可以理解的,但是这种情况会影响到嗓音信号在频域内的估计基本频率的选取。因此本发明根据嗓音信号的频域特点对嗓音信号基本频率进行估计。
通过傅里叶变换确定周期性信号的基频的流程如图3所示,具体步骤如下:
步骤3.1.1:对周期性信号进行傅里叶变换;
步骤3.1.2:在变换后的周期性信号中选取人的嗓音频率范围内的频率,其中的最大峰值位置作为主峰值;
人的嗓音频率范围为50-500Hz;
步骤3.1.3:提取最大峰值位置的1/N位置处的±5%范围内的峰值即作为分峰值,N为整数,N=1,2,3,4,5……;
步骤3.1.4::判断主峰值与分峰值的比值,若该比值小于10,则该主峰值为基频,否则该主峰值不是基频,返回步骤3.1.3,提取最大峰值位置的1/(N+1)位置处的±5%范围内的峰值即作为分峰值,继续判断主峰值与分峰值的比值;
步骤3.1.5:得到周期性信号的基频。
步骤3.2:采用小波变换的方法根据周期性信号进行小波分解和小波重构,得到小波重构信号;
嗓音基频变化范围较大,从低音男性的50Hz到高音女性或儿童的500Hz,接近三个倍频程,根据嗓音信号估计的基础频率不同,小波分解的层数一般为9层以上(包括9层),小波重构的层数一般为6层或7层。
根据理论和实验分析得出:基础频率约为50-172Hz的嗓音信号应选择在第7层进行小波重构;基础频率约为172-344Hz的嗓音信号应选择在第6层进行小波重构;基础频率约为344-500Hz的嗓音信号应选择在第5层进行小波重构。
如图9所示,在离散小波变换(DWT)中,在信号空间Vj=Vj-1+Wj-1上表示信号,也就是说对于每一个在Vj上表示的信号x(t),可以用信号空间横向量Vj-1和信号空间纵向量Wj-1的基函数来表示。
Figure BDA00002741454200111
Figure BDA00002741454200112
在尺度度量空间j对系数A0(k)进行分解得到在尺度度量空间j-1的两个系数A1(k)和D1(k)。同样的,也能从两个系数A1(k)和D1(k)通过重构得到系数A0(k)。
可以通过一定的滤波器组来实现(也就是小波变换算法)小波分解与变换,当小波和尺度在空间内是正交的,采用内积公式计算得到系数cA1k)和D1(k):
Figure BDA00002741454200113
Figure BDA00002741454200114
Figure BDA00002741454200115
内积计算方法的公式如下:
Figure BDA00002741454200116
Figure BDA00002741454200117
Figure BDA00002741454200118
Figure BDA000027414542001110
具体的系数计算过程如下:
Figure BDA000027414542001112
Figure BDA00002741454200121
Figure BDA00002741454200122
Figure BDA00002741454200123
Figure BDA00002741454200124
对于上面的小波分解过程,而重构也只是分解的逆过程,重构算法和分解的算法是相对应而互逆的。
通过以上公式可以求出嗓音信号的小波重构信号。
步骤3.3:对小波重构信号进行周期检测,得到嗓音信号的周期;
对比较复杂的嗓音信号周期检测即转化为对比较简单的小波重构信号的周期检测,小波重构信号的波形是类正弦曲线,对小波重构信号进行周期检测的步骤如下:
步骤3.3.1:通过导数特性检测得到小波重构信号的峰值位置序列;
如图4所示,先对小波重构信号进行一阶求导,判断求得的一阶导数是否有符号变化:有符号变化则对其进行二阶求导,若二阶导数小于0,则该点为峰值点,若二阶导数不小于0,则返回;若求得的一阶导数无符号变化,则返回,继续对下一点一阶求导;
步骤3.3.2:去除峰值位置序列中的重复峰值,得到新的峰值位置序列;
流程如图5所示,去除峰值位置序列中的重复峰值即去掉小波重构信号的峰值位置序列中的频率相同且同为峰值的相邻点,先对峰值位置序列进行一阶求导,判断第n点一阶导数是否小于5,是则比较第n-1点和第n+1点的一阶导数值,若第n-1点的一阶导数小于第n+1点的一阶导数值,则去除峰值位置序列中的第n点,若第n-1点的一阶导数大于第n+1点的一阶导数值,则去除峰值位置序列中的第n+1点,进而得到新的峰值位置序列;若第n点一阶导数不小于5,则返回继续求下一点的一阶导数;
步骤3.3.3:检测步骤3.3.2得到的峰值位置序列中的每个点的前后15%的范围内的极大值,得到小波重构信号的极大值位置序列,其流程如图6所示;
采用同样方法,重复步骤3.3.1~步骤3.3.3可得到原始嗓音周期性信号的极大值位置序列;
步骤3.3.4:将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配,完成周期检测;
如图7所示,将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列里的数值按顺序进行比对,计算相应位置数值之差,若差值<基本周期的20%(基本周期为基频的倒数),则该数值保留,否则舍弃,得到新的嗓音周期性信号的极大值位置序列就是周期性信号的峰值位置序列,进而得到嗓音信号的周期。
步骤4:对周期检测后的嗓音信号进行特征参数提取,并对提取结果进行显示和保存,特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE;
基频(Fundamental Frequency,F0)是声带振动的基础频率,单位为Hz,表示每秒声带振动的次数,是最常用的声学检测指标之一。一般来说,正常男性的基频在130Hz左右,正常女性的基频在250Hz左右,正常儿童的基频在340Hz左右。基频主要是由声带振动的速率决定的。声带振动部分的长度,声带组织的张力以及声带质量的大小是决定基频的三大因素。
微扰分为频率微扰(Jitter)和振幅微扰(Shimmer):基频微扰和振幅微扰主要反映嗓音信号的瞬时变化情况,一般来说,病理嗓音较正常嗓音有更高的基频微扰值和振幅微扰值。嗓音随声带的质量、振动幅度、紧张度而变化,人的嗓音频率与幅度不是衡定不变的,发声时声信号频率与振幅出现微小、快速、不规则的变化,这种变化称之为频率微扰商(FPQ或称Jitter)和振幅微扰商(APQ或称Shimmer),音调微扰与频率的百分比表示频率变动幅度,基本周期平均数除微扰程度得出相对平均微扰。Jitter及Shimmer均表达嗓音信号的短时变化,是反映声带不规律性振动的有效指标,分别反映声音的嘶哑程度及粗糙程度,不同的声样其Shimmer、Jitter不同,发/i/时,声带拉紧,张力较大,通过声门的气流量较发/a/时小,而声门下压则较大,故声带振动相对发/a/时规则,发元音/i/时对Jitter和Shimmer值影响最小,病理状态下更易受代偿影响。
基频微扰(Jitter)是指相邻周期间声波频率的变化率,用于度量指定的一个周期与相邻前几个周期或后几个周期的差异量,反映声带振动周期间频率的差异。
基频微扰有五个计算公式:
Jitter = 100 M - k + 1 &Sigma; n - 1 M - k + 1 | 1 - k * x ( n + m - 1 ) &Sigma; j = 1 k x ( n + j - 1 ) | ( % )
f)基频微扰(RAP)的定义是移动平均数为3
g)基频微扰(PPQ)的定义是移动平均数为5
h)基频微扰(11p)的定义是移动平均数为11
i)基频微扰(abs)的定义是: Jitter ( abs ) = &Sigma; i = 2 M | x ( i ) - x ( i - 1 ) | ( ms )
j)基频微扰(per)的定义是: Jitter ( per ) = Jitter ( abs ) &Sigma; i = 1 M | x ( i ) | M ( % )
x(i)为嗓音信号,k是移动平均长度(k>1,整数),m=(k+1)/2,M是周期数。
一般来说,基频微扰的前三种定义更为恰当,因为它们对声带振动时无意识的变化有明显反映。在本实施方式中,基频微扰(PPQ)是缺省值。
Jitter是用来评价声样中音调的变异率,它表现了相对的周期间(非常短期)的变化程度,表明声带振动的不规律性。
振幅微扰(Shimmer)是描述相邻周期之间声波幅度的变化,可以从测量声波振幅的峰-峰值获得。振幅微扰单位是%,计算公式与基频微扰的相似:
Shimmer = 100 M - k + 1 &Sigma; n - 1 M - k + 1 | 1 - k * x ( n + m - 1 ) &Sigma; j = 1 k x ( n + j - 1 ) | ( % )
e)振幅微扰(3pt)的定义是移动平均数为3
f)振幅微扰(APQ)的定义是移动平均数为5
g)振幅微扰(11p)的定义是移动平均数为11
h)振幅微扰(per)的定义是: Shimmer ( per ) = Shimmer ( abs ) &Sigma; i = 1 M | x ( i ) | M ( % )
x(i)为嗓音信号,k是移动平均长度(k>1,整数),m=(k+1)/2,M是周期数,在本发明中,振幅微扰(APQ)是缺省值。
振幅微扰反映嘶哑声程度,并且主要反映声带振动的稳定性,其值越小,声带振动越稳定,指在发声过程中声学信号出现的微小的、快速的变化。
谐噪比(Hamonics-to-Noise Ratio)是检测病态嗓音和评价嗓音素质的一个客观指标,声音嘶哑的一个客观指标,是谐音成分与噪音成分的比较,谐噪比是谐波能量与噪声能量的比值,对喉部疾病的诊断、治疗效果的判断有重要意义。
信噪比(Signal-to-Noise Ratio):
在本实施方式中采用加零补齐法提取噪音成分:
一个稳态元音的声波包含有周期性重复的谐波分量和附加噪声成份,其中附加噪声成份具有零均值分布。
信号f(t)可以认为是周期信号fr(t)的连接,又因为噪声具有零均值分布,所以当有足够多的fr(t)在一个周期中叠加,就可以去除噪声成份,余下的就是谐波成份。
平均波 f a ( t ) = ( &Sigma; r = 1 n f r ( t ) ) / n
Figure BDA00002741454200151
其中n为基频周期数,fr(t)为周期信号
如Tmax为所有周期中的最大周期,Ti为每个周期的长度,则可设fi(t)=0,Ti<t≤Tmax。即对信号进行补零。
f(t)谐波成份的能量定义为:
Figure BDA00002741454200152
f(t)中噪声成份的能量定义为:
Figure BDA00002741454200153
HNR的定义为:HNR=10lg(H/N)
SNR的定义为:SNR=10lg(S/N)
标准化声门噪声能量NNE主要计算发声时由于声门非完全关闭引起的声门噪声的能量。NNE量反映了发声中由于声门空气泄漏造成的骚动噪声的程度,因此,与嗓音质量的气息声密切相关。声门噪声能量单位是dB,计算公式如下:
NNE = 10 * log &Sigma; n w ( n ) 2 &Sigma; n x ( n ) 2 + BL - - - ( dB )
w(n)代表噪声成分,x(n)代表声学信号,BL为常数,用于补偿滤波器中去除的噪声能量。一般认为,在检测嗓音疾病时,声门噪声能量比谐噪比更灵敏。声门噪声能量在区分病理和正常嗓音是更有效,直接反映了声带的闭合程度。NNE主要反映气息声程度,其次是嘶哑声程度;嘶哑声是气息声和粗糙声的组合。
由以上各个特征值计算方法求得嗓音信号的特征值。
本实施方式中,采集的测试者的嗓音信号数据及特征参数示例,见表1,
表1本装置采集嗓音数据分析结果示例
Figure BDA00002741454200155
Figure BDA00002741454200161
步骤5:对特征参数提取结果和健康嗓音数据的特征参数进行比对分析,得出测试者嗓音状态;
用移动终端采集的病理嗓音数据和健康嗓音数据,并对病理嗓音数据的特征参数和健康嗓音数据的特征参数进行比对分析。根据实验数据分析得到正常人的嗓音特征值参数水平,通过与相关标准进行对比评估得出测试者嗓音的状况,得到正常人嗓音特征值正常范围如下:正常人频率微扰0.18±0.07%、振幅微扰1.60±0.74%、谐噪比25.34±3.12dB、信噪比25.39±3.09dB、声门噪声能量-16.95±3.57dB。男性基频平均值160.81±24.27Hz、女性基频平均值297.42±35.89Hz、基频总平均值206.35±70.77Hz。病理嗓音患者上述结果有不同程度的改变。由相关医学知识可知对应特征值发生异常时对应着相关嗓音病例状况,进行病理分析。
通过将所得测试者的嗓音特征值参数与正常人的嗓音特征值参数值范围的对比,得出测试者声带,喉咙等生理状况,针对不同状况对测试纸进行相应嗓子保护方法的建议和提醒。
步骤6:对分析结果进行显示,并且根据特征参数提取结果和分析结果生成测试者嗓音检测日志,可以根据需要随时查阅。
本实施方式生成的检测日志示例如表2所示,
表2检测日志示例
Figure BDA00002741454200162
通过对测试者嗓音的长期跟踪监测,对测试者嗓音在不同时间段和状况进行相应的提醒,并进行相应的相关保护嗓子的建议以及就医提醒,同时为医生提供患者长期的嗓音状况,为医生诊断提供数据。

Claims (7)

1.一种基于移动终端的嗓音检测评估装置,其特征在于:包括嗓音检测评估终端,用于对嗓音信号进行检测并分析嗓音状态,其包括信号采集及数据保存单元、嗓音信号处理及评估单元和数据输出单元;
所述嗓音检测评估终端采用移动终端;
所述信号采集及数据保存单元包括嗓音信号采集模块、嗓音信号数据保存模块和检测评估结果保存模块;嗓音信号采集模块用于采集测试者的嗓音信号,采集到的嗓音信号在嗓音信号数据保存模块进行保存,嗓音检测评估结果在检测评估结果保存模块进行保存;
所述嗓音信号处理及评估单元包括嗓音信号处理模块、嗓音信号周期检测模块、特征参数提取模块和嗓音信号特征评估分析模块;
嗓音信号处理模块用于截取嗓音信号中的周期性信号;嗓音信号周期检测模块用于对截取的周期性信号进行周期检测;特征参数提取模块用于对嗓音信号周期检测模块的输出信号进行特征参数提取;嗓音信号特征评估分析模块用于对特征参数提取模块的提取结果进行分析,得出测试者嗓音状态;
所述数据输出单元包括嗓音信号输出模块、嗓音信号波形绘制模块和检测日志访问模块;
嗓音信号输出模块用于将嗓音信号特征评估分析模块的分析结果输出到外部,嗓音信号波形绘制模块用于将采集到的测试者的嗓音信号绘制成波形并显示,检测日志访问模块用于将特征参数提取模块的提取结果和嗓音信号特征评估分析模块的分析结果生成检测日志,进行长期跟踪分析。
2.根据权利要求1所述的基于移动终端的嗓音检测评估装置进行嗓音检测评估的方法,其特征在于:包括以下步骤:
步骤1:通过嗓音检测评估终端采集测试者的嗓音信号,将所采集到的嗓音数据绘制波形曲线显示并保存数据;
步骤2:截取采集到的嗓音信号中的周期性信号;
步骤3:对截取的周期性信号进行周期检测;
步骤3.1:通过快速傅里叶变换确定周期性信号的基频;
步骤3.2:采用小波变换的方法对周期性信号进行小波分解和小波重构,得到小波重构信号;
步骤3.3:对小波重构信号进行周期检测,得到嗓音信号的周期;
对小波重构信号进行周期检测的步骤如下:
步骤3.3.1:通过导数特性检测得到小波重构信号的峰值位置序列;
步骤3.3.2:去除峰值位置序列中的重复峰值,得到新的峰值位置序列;
步骤3.3.3:检测步骤3.3.2得到的峰值位置序列中的每个点的前后15%的范围内的极大值,得到小波重构信号的极大值位置序列;
采用同样方法,重复步骤3.3.1~步骤3.3.3可得到原始嗓音周期性信号的极大值位置序列;
步骤3.3.4:将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配,得到嗓音信号周期;
步骤4:对周期检测后的嗓音信号进行特征参数提取,并对提取结果进行显示和保存,特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE;
步骤5:对特征参数提取结果和健康嗓音数据的特征参数进行比对分析,得出测试者嗓音状态;
步骤6:对分析结果进行显示,并且根据特征参数提取结果和分析结果生成测试者嗓音检测日志,可以根据需要随时查阅。
3.根据权利要求2所述的基于移动终端的嗓音检测评估方法,其特征在于:步骤2所述的截取采集到的嗓音信号中的周期性信号,具体方法如下:
步骤2.1:对采集到的嗓音信号进行小波变换,并得到嗓音信号中高频部分的小波系数;
步骤2.2:对小波变换后的嗓音信号进行分帧,计算分帧后每帧信号的小波系数的偏方差值;
步骤2.3:选取小波系数的偏方差值最小的一帧嗓音信号作为周期性信号并保存。
4.根据权利要求2所述的基于移动终端的嗓音检测评估方法,其特征在于:步骤3.1所述的通过快速傅里叶变换确定周期性信号的基频,具体步骤如下:
步骤3.1.1:对周期性信号进行傅里叶变换;
步骤3.1.2:在变换后的周期性信号中选取人的嗓音频率范围内的频率,其中的最大峰值位置作为主峰值;
人的嗓音频率范围为50-500Hz;
步骤3.1.3:提取最大峰值位置的1/N位置处的±5%范围内的峰值即作为分峰值,N为整数,N=1,2,3,4,5……;
步骤3.1.4:判断主峰值与分峰值的比值,若该比值小于10,则该主峰值为基频,否则该主峰值不是基频,返回步骤3.1.3,提取最大峰值位置的1/(N+1)位置处的±5%范围内的峰值即作为分峰值,继续判断主峰值与分峰值的比值;
步骤3.1.5:得到周期性信号的基频。
5.根据权利要求2所述的基于移动终端的嗓音检测评估方法,其特征在于:步骤3.2所述的采用小波变换的方法对周期性信号进行小波分解和小波重构,得到小波重构信号,小波分解的层数至少为9层,小波重构的层数为6层或7层。
6.根据权利要求2所述的基于移动终端的嗓音检测评估方法,其特征在于:步骤3.3.4所述的将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配,完成周期检测,具体是将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列里的数值按顺序进行比对,计算相应位置数值之差,若差值<基本周期的20%,则该数值保留,否则舍弃,得到新的嗓音周期性信号的极大值位置序列就是周期性信号的峰值位置序列,进而得到嗓音信号的周期。
7.根据权利要求2所述的基于移动终端的嗓音检测评估方法,其特征在于:步骤5所述的健康嗓音数据的特征参数,具体如下:正常人频率微扰0.18±0.07 %、振幅微扰1.60±0.74 %、谐噪比25.34±3.12 dB、信噪比25.39±3.09 dB、声门噪声能量-16.95±3.57 dB;男性基频平均值160.81±24.27 Hz、女性基频平均值297.42±35.89 Hz、基频总平均值206.35±70.77 Hz。
CN201310016106.6A 2013-01-16 2013-01-16 一种基于移动终端的嗓音检测评估装置及方法 Active CN103093759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310016106.6A CN103093759B (zh) 2013-01-16 2013-01-16 一种基于移动终端的嗓音检测评估装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310016106.6A CN103093759B (zh) 2013-01-16 2013-01-16 一种基于移动终端的嗓音检测评估装置及方法

Publications (2)

Publication Number Publication Date
CN103093759A true CN103093759A (zh) 2013-05-08
CN103093759B CN103093759B (zh) 2014-12-10

Family

ID=48206263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310016106.6A Active CN103093759B (zh) 2013-01-16 2013-01-16 一种基于移动终端的嗓音检测评估装置及方法

Country Status (1)

Country Link
CN (1) CN103093759B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103730130A (zh) * 2013-12-20 2014-04-16 中国科学院深圳先进技术研究院 一种病理嗓音的检测方法和系统
CN104523236A (zh) * 2015-01-07 2015-04-22 厦门大学 一种抗干扰的喉振动发声测评装置
WO2017000813A1 (zh) * 2015-06-30 2017-01-05 芋头科技(杭州)有限公司 一种室内噪声污染自动识别监测系统
CN108269590A (zh) * 2018-01-17 2018-07-10 广州势必可赢网络科技有限公司 一种声带恢复评分方法及装置
CN109671443A (zh) * 2017-10-13 2019-04-23 医疗财团法人徐元智先生医药基金会亚东纪念医院 嗓音即时监测系统
CN109727608A (zh) * 2017-10-25 2019-05-07 香港中文大学深圳研究院 一种基于中文语音的病态嗓音评估方法
CN110021435A (zh) * 2017-09-07 2019-07-16 医疗财团法人徐元智先生医药基金会亚东纪念医院 嗓音侦测分类系统
CN110074759A (zh) * 2019-04-23 2019-08-02 平安科技(深圳)有限公司 语音数据辅助诊断方法、装置、计算机设备及存储介质
CN110876608A (zh) * 2019-06-27 2020-03-13 上海慧敏医疗器械有限公司 基频实时测量和视听反馈技术的发声康复仪器及方法
CN111554325A (zh) * 2020-05-09 2020-08-18 陕西师范大学 一种嗓音识别方法及系统
CN116110437A (zh) * 2023-04-14 2023-05-12 天津大学 基于语音特征和说话人特征融合的病理嗓音质量评价方法
CN116473521A (zh) * 2023-06-21 2023-07-25 四川大学华西医院 疑似环杓关节脱位声音频谱识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4276445A (en) * 1979-09-07 1981-06-30 Kay Elemetrics Corp. Speech analysis apparatus
CN101452698A (zh) * 2007-11-29 2009-06-10 中国科学院声学研究所 一种自动嗓音谐噪比分析方法
CN101466157A (zh) * 2008-12-23 2009-06-24 深圳市卓意互动科技有限公司 手机及基于手机的无线医疗健康检测监护系统
CN201814659U (zh) * 2010-10-20 2011-05-04 重庆理工大学 智能化喉疾诊断仪

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4276445A (en) * 1979-09-07 1981-06-30 Kay Elemetrics Corp. Speech analysis apparatus
CN101452698A (zh) * 2007-11-29 2009-06-10 中国科学院声学研究所 一种自动嗓音谐噪比分析方法
CN101466157A (zh) * 2008-12-23 2009-06-24 深圳市卓意互动科技有限公司 手机及基于手机的无线医疗健康检测监护系统
CN201814659U (zh) * 2010-10-20 2011-05-04 重庆理工大学 智能化喉疾诊断仪

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103730130B (zh) * 2013-12-20 2019-03-01 中国科学院深圳先进技术研究院 一种病理嗓音的检测系统
CN103730130A (zh) * 2013-12-20 2014-04-16 中国科学院深圳先进技术研究院 一种病理嗓音的检测方法和系统
CN104523236A (zh) * 2015-01-07 2015-04-22 厦门大学 一种抗干扰的喉振动发声测评装置
WO2017000813A1 (zh) * 2015-06-30 2017-01-05 芋头科技(杭州)有限公司 一种室内噪声污染自动识别监测系统
CN110021435A (zh) * 2017-09-07 2019-07-16 医疗财团法人徐元智先生医药基金会亚东纪念医院 嗓音侦测分类系统
CN109671443B (zh) * 2017-10-13 2020-10-23 医疗财团法人徐元智先生医药基金会亚东纪念医院 嗓音即时监测系统
CN109671443A (zh) * 2017-10-13 2019-04-23 医疗财团法人徐元智先生医药基金会亚东纪念医院 嗓音即时监测系统
CN109727608A (zh) * 2017-10-25 2019-05-07 香港中文大学深圳研究院 一种基于中文语音的病态嗓音评估方法
CN108269590A (zh) * 2018-01-17 2018-07-10 广州势必可赢网络科技有限公司 一种声带恢复评分方法及装置
CN110074759A (zh) * 2019-04-23 2019-08-02 平安科技(深圳)有限公司 语音数据辅助诊断方法、装置、计算机设备及存储介质
CN110876608A (zh) * 2019-06-27 2020-03-13 上海慧敏医疗器械有限公司 基频实时测量和视听反馈技术的发声康复仪器及方法
CN111554325A (zh) * 2020-05-09 2020-08-18 陕西师范大学 一种嗓音识别方法及系统
CN111554325B (zh) * 2020-05-09 2023-03-24 陕西师范大学 一种嗓音识别方法及系统
CN116110437A (zh) * 2023-04-14 2023-05-12 天津大学 基于语音特征和说话人特征融合的病理嗓音质量评价方法
CN116473521A (zh) * 2023-06-21 2023-07-25 四川大学华西医院 疑似环杓关节脱位声音频谱识别方法及系统
CN116473521B (zh) * 2023-06-21 2023-08-18 四川大学华西医院 疑似环杓关节脱位声音频谱识别方法及系统

Also Published As

Publication number Publication date
CN103093759B (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN103093759B (zh) 一种基于移动终端的嗓音检测评估装置及方法
Parsa et al. Identification of pathological voices using glottal noise measures
EP3367908B1 (en) Programmable electronic stethoscope devices, algorithms, systems, and methods
Teixeira et al. Vocal acoustic analysis–jitter, shimmer and hnr parameters
Awan et al. Toward the development of an objective index of dysphonia severity: a four‐factor acoustic model
Awan et al. Outcomes measurement in voice disorders: application of an acoustic index of dysphonia severity
Matos et al. Detection of cough signals in continuous audio recordings using hidden Markov models
Eskenazi et al. Acoustic correlates of vocal quality
CN102429662B (zh) 家庭环境中睡眠呼吸暂停综合征的筛查系统
CN100418480C (zh) 基于心音分析的心脏病自动分类系统及其心音分段方法
CN104055529B (zh) 一种计算情感心电信号标度指数的方法
CN103251388B (zh) 基于智能手机平台的打鼾监测方法和监测及防治系统
Manfredi et al. A comparative analysis of fundamental frequency estimation methods with application to pathological voices
Kuresan et al. Fusion of WPT and MFCC feature extraction in Parkinson’s disease diagnosis
Hartelius et al. Long-term phonatory instability in individuals with multiple sclerosis
US20030078768A1 (en) Method for analysis of vocal jitter for near-term suicidal risk assessment
CN103546853A (zh) 一种基于短时傅里叶变换的扬声器异常音检测方法
Qian et al. Automatic detection, segmentation and classification of snore related signals from overnight audio recording
CN100571452C (zh) 扬声器纯音检测方法
Prosek et al. An evaluation of residue features as correlates of voice disorders
Bhateja et al. Pre-processing and classification of cough sounds in noisy environment using SVM
Murphy Spectral characterization of jitter, shimmer, and additive noise in synthetically generated voice signals
CN105868532A (zh) 一种智能评估心脏衰老程度的方法及系统
Fernandes et al. Parameters for vocal acoustic analysis-cured database
CN103519785B (zh) 基于实时语音多维建模的语音障碍多维测量系统及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant