CN108520759B - 用于帕金森病语音检测的时频特征图像提取方法 - Google Patents

用于帕金森病语音检测的时频特征图像提取方法 Download PDF

Info

Publication number
CN108520759B
CN108520759B CN201810329076.7A CN201810329076A CN108520759B CN 108520759 B CN108520759 B CN 108520759B CN 201810329076 A CN201810329076 A CN 201810329076A CN 108520759 B CN108520759 B CN 108520759B
Authority
CN
China
Prior art keywords
frequency
time
matrix
contour line
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810329076.7A
Other languages
English (en)
Other versions
CN108520759A (zh
Inventor
王波
赵彦平
胡封晔
张颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201810329076.7A priority Critical patent/CN108520759B/zh
Publication of CN108520759A publication Critical patent/CN108520759A/zh
Application granted granted Critical
Publication of CN108520759B publication Critical patent/CN108520759B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4082Diagnosing or monitoring movement diseases, e.g. Parkinson, Huntington or Tourette
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Neurology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Neurosurgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physiology (AREA)
  • Developmental Disabilities (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了用于帕金森病语音检测的时频特征图像提取方法,为克服现有技术不能全面反映帕金森病语音的特点,增加了分类方法进行帕金森病语音检测难度的问题,步骤:1)对语音信号进行预处理;2)对语音信号进行时频特征提取:(1)对预处理后的语音信号进行短时离散傅里叶变换;(2)频率归一化得到单位频率功率谱时频矩阵;(3)构造线性频率三角形滤波器组;(4)频域滤波;(5)得到幅度谱时频矩阵;3)得到等高线时频特征图像:把幅度谱矩阵上数值最大的点和参考平面之间的距离分成n等份,把数值相等的点连成闭合曲线并垂直投影到参考平面,形成n条等高线时频特征图,把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。

Description

用于帕金森病语音检测的时频特征图像提取方法
技术领域
本发明涉及信号处理技术领域的时频特征提取方法,更确切地说,本发明涉及一种用于帕金森病语音检测的时频特征图像提取方法。
背景技术
帕金森病是仅次于阿茨海默综合症的第二大神经系统退行性疾病,病因尚不明确,也没有药物能够治疗。该病的主要症状有静止性震颤、步行障碍、肌强直和运动迟缓等。研究表明大多数帕金森病患者具有发音障碍,语言功能退化是首发症状之一,主要表现为基音频率变化、声音颤抖、声音强度降低以及讲话速度异常等。帕金森病患者大多是老年人,随着老龄化社会的到来,该病的比重日益增加,同时患者也有年轻化的趋势。考虑到该疾病发展较慢,及早发现帕金森病,对控制病情发展,提高患者生活质量具有重要意义。
基于语音的帕金森病检测由于方便、经济、具有非入侵等特点而被广泛研究,其过程包括提取语音特征、模型训练和分类三个主要步骤。提取的语音特征包括基音频率、基音频率的变化Jitter、声音幅度的变化Shimmer、能量、倒谱参数以及均值、标准差、偏度和峰度等统计特征。这些特征单独在时频或频域进行提取,不能全面的反映帕金森病语音的特点,增加了分类方法进行帕金森病语音检测的难度。
本发明利用语音幅度谱时频矩阵,提取等高线时频特征图像,该图像能够反映主要传统语音特征,比如基音频率的变化Ji tter,谐波频率的变化,时长等信息,同时又能去除不必要的干扰成份。帕金森病语音等高线时频特征图像能够作为后续实现帕金森病语音检测的图像分类方法的输入数据。
发明内容
本发明所要解决的技术问题是克服了现有语音特征单独在时域或频域进行提取,不能全面反映帕金森病语音的特点,增加了分类方法进行帕金森病语音检测难度的问题,提供了一种用于帕金森病语音检测的时频特征图像提取方法。
为解决上述技术问题,本发明是采用如下技术方案实现的:所述的用于帕金森病语音检测的时频特征图像提取方法的步骤如下:
1)对语音信号进行预处理,步骤如下:
利用语音采集设备在相对安静的环境中采集元音/a/的发音,降采样到固定频率fs,分帧的帧长为N个采样点,帧移为L个采样点,加窗,得到时域矩阵SM×N,其中M表示帧数,由语音信号的长度决定;
2)对语音信号进行时频特征提取,步骤如下:
(1)对预处理后的语音信号进行短时离散傅立叶变换,得到短时傅立叶系数的时频矩阵SFM×NF,其中NF为傅立叶变换的点数;
(2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs
(3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P,P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
(4)单位频率功率谱时频矩阵中每一列分别通过步骤(3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中P为滤波器的个数;
(5)对SPM×P进行开方运算,乘以调整参数α进行幅度调整,得到幅度谱时频矩阵
Figure GDA0002965530710000021
3)得到等高线时频特征图像,步骤如下:
(1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份,n=10,把数值相等的点连成闭合曲线并垂直投影到数值为5×10-4的参考平面,形成n条等高线时频特征图;
(2)把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。
与现有技术相比本发明的有益效果是:
1.本发明所述的用于帕金森病语音检测的时频特征图像提取方法利用语音幅度谱时频矩阵提取等高线时频特征图像,即减少了无用的信息,又很好地体现了基音频率以及各次谐波、能量和时长等主要信息。
2.本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的等高线时频特征图像,具有稀疏的特点,能够减少后续进行模型训练和分类方法的计算量。
附图说明
下面结合附图对本发明作进一步的说明:
图1是本发明所述的用于帕金森病语音检测的时频特征图像提取方法的流程框图;
图2是采用本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的健康语音等高线时频特征图像;
图3是采用本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的帕金森病语音等高线时频特征图像。
具体实施方式
下面结合附图对本发明作详细的描述:
参阅图1,本发明所述的一种用于帕金森病语音检测的时频特征图像提取方法的步骤为:
1.对语音信号进行预处理,步骤如下:
利用语音采集设备在相对安静的环境中采集元音/a/的发音,降采样到固定频率fs,分帧的帧长为N个采样点,帧移为L个采样点,加窗,得到时域矩阵SM×N,其中M表示帧数,由语音信号的长度决定;
2.对语音信号进行时频特征提取,步骤如下:
1)对预处理后的语音信号进行短时离散傅立叶变换,得到短时傅立叶系数的时频矩阵SFM×NF,其中NF为傅立叶变换的点数;
2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs
3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P,P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
4)单位频率功率谱时频矩阵中每一列分别通过步骤3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中P为滤波器的个数;
5)对SPM×P进行开方运算,乘以调整参数α进行幅度调整,得到幅度谱时频矩阵
Figure GDA0002965530710000031
3.得到等高线时频特征图像,步骤如下:
1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份,n=10,把数值相等的点连成闭合曲线并垂直投影到数值为5×10-4的参考平面(曲线颜色越亮表示功率越大),形成n条等高线时频特征图;
2)把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。
实施例:
语音信号具有随机性,幅度谱时频矩阵随着输入语音信号不同而发生改变,由幅度谱时频矩阵得到等高线时频特征图像需要利用计算机软件进行画图,本实施例中利用MATLAB仿真软件。帕金森病语音/a/来自UCI机器学习数据库中的帕金森病语音库,健康语音是利用智能手机在安静环境中录制的一段元音/a/。分别对健康语音/a/和帕金森病语音/a/进行等高线时频特征图像提取,步骤如下。
1.对语音信号进行预处理,步骤如下:
采样频率降采样到固定频率fs=16KHz,分帧的帧长为N=1448个采样点,帧移为L=160个采样点,加汉明窗,得到时域矩阵SM×N,其中M表示帧数,由语音信号的长度决定;
2.对语音信号进行时频特征提取,步骤如下:
1)对预处理后的语音信号进行短时离散傅立叶变换,傅立叶变换的点数为NF=8192,得到短时傅立叶系数的时频矩阵SFM×NF
2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs
3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G=0.35,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
4)单位频率功率谱时频矩阵中每一列分别通过步骤3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中滤波器的个数P=1601;
5)对SPM×P进行开方运算,乘以调整参数α=1进行幅度调整,得到幅度谱时频矩阵
Figure GDA0002965530710000041
3.得到等高线时频特征图像,步骤如下:
1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成10等份,参考平面的数值设为5×10-4,把数值相等的点连成闭合曲线并垂直投影到参考平面,形成10条等高线时频特征图;
2)把等高线时频特征图转换为JPEG图像,分别得到健康语音/a/和帕金森病语音/a/的等高线时频特征图像。健康语音等高线时频特征图像仿真图参阅图2,图中水平方向表示时间,垂直方向表示频率,图像中颜色越亮表示信号功率较大,若干横向条纹体现基音频率和各次谐波;帕金森病语音等高线时频特征图像仿真图参阅图3,从图中可以看出等高线时频特征图像在时频域体现了大部分传统帕金森病语音特征,如基于频率的变化Jitter,谐波频率的变化,时长等,同时去除了无用的干扰成份,等高线时频特征图像具有稀疏的特点,背景单一,属于简单图像,减少了后续模型训练和分类方法的计算量;帕金森病语音等高线时频特征图像与健康语音时频特征图像相比较有很大的不同,帕金森病语音的基音频率及各次谐波在频率方向上有很大波动,而且低频段出现干扰,所以利用等高线时频特征图像很容易检测出帕金森病语音。

Claims (1)

1.一种用于帕金森病语音检测的时频特征图像提取方法,其特征在于,所述的用于帕金森病语音检测的时频特征图像提取方法的步骤如下:
1)对语音信号进行预处理,步骤如下:
利用语音采集设备在相对安静的环境中采集元音/a/的发音,降采样到固定频率fs,分帧的帧长为N个采样点,帧移为L个采样点,加窗,得到时域矩阵SM×N,其中M表示帧数,由信号的长度决定;
2)对语音信号进行时频特征提取,步骤如下:
(1)对预处理后的语音信号进行短时离散傅立叶变换,得到短时傅立叶系数的时频矩阵SFM×NF,其中NF为傅立叶变换的点数;
(2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs
(3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P,P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
(4)单位频率功率谱时频矩阵中每一列分别通过步骤(3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中P为滤波器的个数;
(5)对SPM×P进行开方运算,乘以调整参数α进行幅度调整,得到幅度谱时频矩阵
Figure FDA0002965530700000011
α=1;
3)得到等高线时频特征图像,步骤如下:
(1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份,n=10,把数值相等的点连成闭合曲线并垂直投影到数值为5×10-4的参考平面,形成n条等高线时频特征图;
(2)把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。
CN201810329076.7A 2018-04-13 2018-04-13 用于帕金森病语音检测的时频特征图像提取方法 Expired - Fee Related CN108520759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810329076.7A CN108520759B (zh) 2018-04-13 2018-04-13 用于帕金森病语音检测的时频特征图像提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810329076.7A CN108520759B (zh) 2018-04-13 2018-04-13 用于帕金森病语音检测的时频特征图像提取方法

Publications (2)

Publication Number Publication Date
CN108520759A CN108520759A (zh) 2018-09-11
CN108520759B true CN108520759B (zh) 2021-05-11

Family

ID=63432516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810329076.7A Expired - Fee Related CN108520759B (zh) 2018-04-13 2018-04-13 用于帕金森病语音检测的时频特征图像提取方法

Country Status (1)

Country Link
CN (1) CN108520759B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109616141B (zh) * 2019-01-03 2022-01-11 燕山大学 发音异常检测方法
CN110189765B (zh) * 2019-04-25 2021-08-20 武汉大晟极科技有限公司 基于频谱形状的语音特征估计方法
CN110335624A (zh) * 2019-07-29 2019-10-15 吉林大学 基于功率归一化倒谱系数特征的帕金森病语音检测方法
CN113361563B (zh) * 2021-04-22 2022-11-25 重庆大学 一种基于样本和特征双变换的帕金森病语音数据分类系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622331A (zh) * 2012-02-10 2012-08-01 程涛 一种基于压缩感知的高斯矩阵优化方法
CN105448291A (zh) * 2015-12-02 2016-03-30 南京邮电大学 基于语音的帕金森症检测方法及检测系统
CN107862060A (zh) * 2017-11-15 2018-03-30 吉林大学 一种追踪目标人的语义识别装置及识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9579056B2 (en) * 2012-10-16 2017-02-28 University Of Florida Research Foundation, Incorporated Screening for neurological disease using speech articulation characteristics
JP6639285B2 (ja) * 2016-03-15 2020-02-05 株式会社東芝 声質嗜好学習装置、声質嗜好学習方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622331A (zh) * 2012-02-10 2012-08-01 程涛 一种基于压缩感知的高斯矩阵优化方法
CN105448291A (zh) * 2015-12-02 2016-03-30 南京邮电大学 基于语音的帕金森症检测方法及检测系统
CN107862060A (zh) * 2017-11-15 2018-03-30 吉林大学 一种追踪目标人的语义识别装置及识别方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A two-stage variable selection and classification approach for Parkinson"s disease detection by using voice recording replications;Lizbeth Naranjo,Jacinto Martín;《Computer Methods and Programs in Biomedicine》;20170430;第147-156页 *
Classification of Parkinson’s disease utilizing multi-edit nearest-neighbor and ensemble learning algorithms with speech samples;He‑Hua Zhang1, Liuyang Yang2, Yuchuan Liu,Pin Wang,et al;《BioMedical Engineering OnLine》;20161116;第1-22页 *
Generating Intelligible Audio Speech From Visual Speech;Thomas Le Cornu,Ben Milner;《IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》;20170930;第25卷(第9期);第1751-1761页 *
一种改进动态特征参数的话者语音识别系统;申小虎,万荣春,张新野;《计算机仿真》;20150430;第32卷(第4期);第154-158页 *
基于SPWD 时频脊特征提取的汉语声调识别;徐郑丹,于凤芹;《计算机应用与软件》;20140331;第31卷(第3期);第142-145页 *
老年人教育背景、年龄对言语流畅性的影响;胡云霄;《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》;中国学术期刊(光盘版)电子杂志社;20171015(第10期);第F102-27页 *

Also Published As

Publication number Publication date
CN108520759A (zh) 2018-09-11

Similar Documents

Publication Publication Date Title
CN108520759B (zh) 用于帕金森病语音检测的时频特征图像提取方法
US11961533B2 (en) Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments
CN108198545B (zh) 一种基于小波变换的语音识别方法
CN110570880B (zh) 一种鼾声信号识别方法
Kapoor et al. Parkinson’s disease diagnosis using Mel-frequency cepstral coefficients and vector quantization
CN111291614A (zh) 基于迁移学习多模型决策融合的儿童癫痫综合症分类方法
Winursito et al. Feature data reduction of MFCC using PCA and SVD in speech recognition system
CN108564965B (zh) 一种抗噪语音识别系统
CN114613389A (zh) 一种基于改进mfcc的非语音类音频特征提取方法
CN112542174A (zh) 基于vad的多维特征参数声纹识别方法
Fazel et al. Sparse auditory reproducing kernel (SPARK) features for noise-robust speech recognition
CN113796889A (zh) 一种基于深度学习的辅助电子听诊器信号判别方法
CN111508504B (zh) 基于听觉中枢感知机理的说话人识别方法
CN101930733A (zh) 一种用于语音情感识别的语音情感特征提取方法
Saritha et al. Enhancement in speaker recognition using SincNet through optimal window and frame shift
CN114822567B (zh) 一种基于能量算子的病理嗓音频谱重构方法
Salhi et al. Robustness of auditory teager energy cepstrum coefficients for classification of pathological and normal voices in noisy environments
CN112309404B (zh) 机器语音的鉴别方法、装置、设备及存储介质
CN104064197A (zh) 一种基于语音帧间动态信息提高语音识别鲁棒性的方法
Li et al. Learnable frequency filters for speech feature extraction in speaker verification
CN113948088A (zh) 基于波形模拟的语音识别方法及装置
Taoufiq et al. Cepstral Coefficient Extraction using the MFCC with the Discrete Wavelet Transform for the Parkinson’s Disease Diagnosis
CN111816186A (zh) 一种声纹识别的特征参数提取系统及方法
Zhu et al. A study of the robustness of raw waveform based speaker embeddings under mismatched conditions
Tian et al. Application of wavelet in speech processing of cochlear implant

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210511