CN108520759B - 用于帕金森病语音检测的时频特征图像提取方法 - Google Patents
用于帕金森病语音检测的时频特征图像提取方法 Download PDFInfo
- Publication number
- CN108520759B CN108520759B CN201810329076.7A CN201810329076A CN108520759B CN 108520759 B CN108520759 B CN 108520759B CN 201810329076 A CN201810329076 A CN 201810329076A CN 108520759 B CN108520759 B CN 108520759B
- Authority
- CN
- China
- Prior art keywords
- frequency
- time
- matrix
- contour line
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 208000018737 Parkinson disease Diseases 0.000 title claims abstract description 29
- 238000000605 extraction Methods 0.000 title claims abstract description 20
- 238000001514 detection method Methods 0.000 title claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 35
- 238000001228 spectrum Methods 0.000 claims abstract description 27
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000005070 sampling Methods 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 abstract description 7
- 208000027089 Parkinsonian disease Diseases 0.000 description 7
- 206010034010 Parkinsonism Diseases 0.000 description 7
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 206010044565 Tremor Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 206010006100 Bradykinesia Diseases 0.000 description 1
- 206010013887 Dysarthria Diseases 0.000 description 1
- 208000012661 Dyskinesia Diseases 0.000 description 1
- 208000006083 Hypokinesia Diseases 0.000 description 1
- 206010061533 Myotonia Diseases 0.000 description 1
- 206010071390 Resting tremor Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/40—Detecting, measuring or recording for evaluating the nervous system
- A61B5/4076—Diagnosing or monitoring particular conditions of the nervous system
- A61B5/4082—Diagnosing or monitoring movement diseases, e.g. Parkinson, Huntington or Tourette
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Neurology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Biophysics (AREA)
- Heart & Thoracic Surgery (AREA)
- Physiology (AREA)
- Developmental Disabilities (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了用于帕金森病语音检测的时频特征图像提取方法,为克服现有技术不能全面反映帕金森病语音的特点,增加了分类方法进行帕金森病语音检测难度的问题,步骤:1)对语音信号进行预处理;2)对语音信号进行时频特征提取:(1)对预处理后的语音信号进行短时离散傅里叶变换;(2)频率归一化得到单位频率功率谱时频矩阵;(3)构造线性频率三角形滤波器组;(4)频域滤波;(5)得到幅度谱时频矩阵;3)得到等高线时频特征图像:把幅度谱矩阵上数值最大的点和参考平面之间的距离分成n等份,把数值相等的点连成闭合曲线并垂直投影到参考平面,形成n条等高线时频特征图,把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。
Description
技术领域
本发明涉及信号处理技术领域的时频特征提取方法,更确切地说,本发明涉及一种用于帕金森病语音检测的时频特征图像提取方法。
背景技术
帕金森病是仅次于阿茨海默综合症的第二大神经系统退行性疾病,病因尚不明确,也没有药物能够治疗。该病的主要症状有静止性震颤、步行障碍、肌强直和运动迟缓等。研究表明大多数帕金森病患者具有发音障碍,语言功能退化是首发症状之一,主要表现为基音频率变化、声音颤抖、声音强度降低以及讲话速度异常等。帕金森病患者大多是老年人,随着老龄化社会的到来,该病的比重日益增加,同时患者也有年轻化的趋势。考虑到该疾病发展较慢,及早发现帕金森病,对控制病情发展,提高患者生活质量具有重要意义。
基于语音的帕金森病检测由于方便、经济、具有非入侵等特点而被广泛研究,其过程包括提取语音特征、模型训练和分类三个主要步骤。提取的语音特征包括基音频率、基音频率的变化Jitter、声音幅度的变化Shimmer、能量、倒谱参数以及均值、标准差、偏度和峰度等统计特征。这些特征单独在时频或频域进行提取,不能全面的反映帕金森病语音的特点,增加了分类方法进行帕金森病语音检测的难度。
本发明利用语音幅度谱时频矩阵,提取等高线时频特征图像,该图像能够反映主要传统语音特征,比如基音频率的变化Ji tter,谐波频率的变化,时长等信息,同时又能去除不必要的干扰成份。帕金森病语音等高线时频特征图像能够作为后续实现帕金森病语音检测的图像分类方法的输入数据。
发明内容
本发明所要解决的技术问题是克服了现有语音特征单独在时域或频域进行提取,不能全面反映帕金森病语音的特点,增加了分类方法进行帕金森病语音检测难度的问题,提供了一种用于帕金森病语音检测的时频特征图像提取方法。
为解决上述技术问题,本发明是采用如下技术方案实现的:所述的用于帕金森病语音检测的时频特征图像提取方法的步骤如下:
1)对语音信号进行预处理,步骤如下:
利用语音采集设备在相对安静的环境中采集元音/a/的发音,降采样到固定频率fs,分帧的帧长为N个采样点,帧移为L个采样点,加窗,得到时域矩阵SM×N,其中M表示帧数,由语音信号的长度决定;
2)对语音信号进行时频特征提取,步骤如下:
(1)对预处理后的语音信号进行短时离散傅立叶变换,得到短时傅立叶系数的时频矩阵SFM×NF,其中NF为傅立叶变换的点数;
(2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs;
(3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P,P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
(4)单位频率功率谱时频矩阵中每一列分别通过步骤(3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中P为滤波器的个数;
3)得到等高线时频特征图像,步骤如下:
(1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份,n=10,把数值相等的点连成闭合曲线并垂直投影到数值为5×10-4的参考平面,形成n条等高线时频特征图;
(2)把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。
与现有技术相比本发明的有益效果是:
1.本发明所述的用于帕金森病语音检测的时频特征图像提取方法利用语音幅度谱时频矩阵提取等高线时频特征图像,即减少了无用的信息,又很好地体现了基音频率以及各次谐波、能量和时长等主要信息。
2.本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的等高线时频特征图像,具有稀疏的特点,能够减少后续进行模型训练和分类方法的计算量。
附图说明
下面结合附图对本发明作进一步的说明:
图1是本发明所述的用于帕金森病语音检测的时频特征图像提取方法的流程框图;
图2是采用本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的健康语音等高线时频特征图像;
图3是采用本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的帕金森病语音等高线时频特征图像。
具体实施方式
下面结合附图对本发明作详细的描述:
参阅图1,本发明所述的一种用于帕金森病语音检测的时频特征图像提取方法的步骤为:
1.对语音信号进行预处理,步骤如下:
利用语音采集设备在相对安静的环境中采集元音/a/的发音,降采样到固定频率fs,分帧的帧长为N个采样点,帧移为L个采样点,加窗,得到时域矩阵SM×N,其中M表示帧数,由语音信号的长度决定;
2.对语音信号进行时频特征提取,步骤如下:
1)对预处理后的语音信号进行短时离散傅立叶变换,得到短时傅立叶系数的时频矩阵SFM×NF,其中NF为傅立叶变换的点数;
2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs;
3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P,P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
4)单位频率功率谱时频矩阵中每一列分别通过步骤3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中P为滤波器的个数;
3.得到等高线时频特征图像,步骤如下:
1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份,n=10,把数值相等的点连成闭合曲线并垂直投影到数值为5×10-4的参考平面(曲线颜色越亮表示功率越大),形成n条等高线时频特征图;
2)把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。
实施例:
语音信号具有随机性,幅度谱时频矩阵随着输入语音信号不同而发生改变,由幅度谱时频矩阵得到等高线时频特征图像需要利用计算机软件进行画图,本实施例中利用MATLAB仿真软件。帕金森病语音/a/来自UCI机器学习数据库中的帕金森病语音库,健康语音是利用智能手机在安静环境中录制的一段元音/a/。分别对健康语音/a/和帕金森病语音/a/进行等高线时频特征图像提取,步骤如下。
1.对语音信号进行预处理,步骤如下:
采样频率降采样到固定频率fs=16KHz,分帧的帧长为N=1448个采样点,帧移为L=160个采样点,加汉明窗,得到时域矩阵SM×N,其中M表示帧数,由语音信号的长度决定;
2.对语音信号进行时频特征提取,步骤如下:
1)对预处理后的语音信号进行短时离散傅立叶变换,傅立叶变换的点数为NF=8192,得到短时傅立叶系数的时频矩阵SFM×NF;
2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs;
3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G=0.35,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
4)单位频率功率谱时频矩阵中每一列分别通过步骤3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中滤波器的个数P=1601;
3.得到等高线时频特征图像,步骤如下:
1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成10等份,参考平面的数值设为5×10-4,把数值相等的点连成闭合曲线并垂直投影到参考平面,形成10条等高线时频特征图;
2)把等高线时频特征图转换为JPEG图像,分别得到健康语音/a/和帕金森病语音/a/的等高线时频特征图像。健康语音等高线时频特征图像仿真图参阅图2,图中水平方向表示时间,垂直方向表示频率,图像中颜色越亮表示信号功率较大,若干横向条纹体现基音频率和各次谐波;帕金森病语音等高线时频特征图像仿真图参阅图3,从图中可以看出等高线时频特征图像在时频域体现了大部分传统帕金森病语音特征,如基于频率的变化Jitter,谐波频率的变化,时长等,同时去除了无用的干扰成份,等高线时频特征图像具有稀疏的特点,背景单一,属于简单图像,减少了后续模型训练和分类方法的计算量;帕金森病语音等高线时频特征图像与健康语音时频特征图像相比较有很大的不同,帕金森病语音的基音频率及各次谐波在频率方向上有很大波动,而且低频段出现干扰,所以利用等高线时频特征图像很容易检测出帕金森病语音。
Claims (1)
1.一种用于帕金森病语音检测的时频特征图像提取方法,其特征在于,所述的用于帕金森病语音检测的时频特征图像提取方法的步骤如下:
1)对语音信号进行预处理,步骤如下:
利用语音采集设备在相对安静的环境中采集元音/a/的发音,降采样到固定频率fs,分帧的帧长为N个采样点,帧移为L个采样点,加窗,得到时域矩阵SM×N,其中M表示帧数,由信号的长度决定;
2)对语音信号进行时频特征提取,步骤如下:
(1)对预处理后的语音信号进行短时离散傅立叶变换,得到短时傅立叶系数的时频矩阵SFM×NF,其中NF为傅立叶变换的点数;
(2)频率归一化得到单位频率功率谱时频矩阵SPM×(NF/2+1)=|SFM×(NF/2+1)|2/fs;
(3)构造线性频率三角形滤波器组:
设三角形滤波器组的个数为P,P=1601,滤波器组在[0,fs/2]范围内线性分布,中心频率间隔为(fs/2)/(P-1)Hz,中心频率的增益均为G,相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)=H(p-1)=L(p+1),其中:C(p)表示第p个三角形滤波器的中心频率,H(p-1)为第p-1个三角形滤波器的上限频率,L(p+1)为第p+1个三角形滤波器的下限频率;
(4)单位频率功率谱时频矩阵中每一列分别通过步骤(3)中的线性频率三角形滤波组,得到滤波后的单位频率功率谱时频矩阵SPM×P,其中P为滤波器的个数;
3)得到等高线时频特征图像,步骤如下:
(1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份,n=10,把数值相等的点连成闭合曲线并垂直投影到数值为5×10-4的参考平面,形成n条等高线时频特征图;
(2)把等高线时频特征图转换为JPEG图像,得到等高线时频特征图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810329076.7A CN108520759B (zh) | 2018-04-13 | 2018-04-13 | 用于帕金森病语音检测的时频特征图像提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810329076.7A CN108520759B (zh) | 2018-04-13 | 2018-04-13 | 用于帕金森病语音检测的时频特征图像提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108520759A CN108520759A (zh) | 2018-09-11 |
CN108520759B true CN108520759B (zh) | 2021-05-11 |
Family
ID=63432516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810329076.7A Expired - Fee Related CN108520759B (zh) | 2018-04-13 | 2018-04-13 | 用于帕金森病语音检测的时频特征图像提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108520759B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109616141B (zh) * | 2019-01-03 | 2022-01-11 | 燕山大学 | 发音异常检测方法 |
CN110189765B (zh) * | 2019-04-25 | 2021-08-20 | 武汉大晟极科技有限公司 | 基于频谱形状的语音特征估计方法 |
CN110335624A (zh) * | 2019-07-29 | 2019-10-15 | 吉林大学 | 基于功率归一化倒谱系数特征的帕金森病语音检测方法 |
CN113361563B (zh) * | 2021-04-22 | 2022-11-25 | 重庆大学 | 一种基于样本和特征双变换的帕金森病语音数据分类系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622331A (zh) * | 2012-02-10 | 2012-08-01 | 程涛 | 一种基于压缩感知的高斯矩阵优化方法 |
CN105448291A (zh) * | 2015-12-02 | 2016-03-30 | 南京邮电大学 | 基于语音的帕金森症检测方法及检测系统 |
CN107862060A (zh) * | 2017-11-15 | 2018-03-30 | 吉林大学 | 一种追踪目标人的语义识别装置及识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9579056B2 (en) * | 2012-10-16 | 2017-02-28 | University Of Florida Research Foundation, Incorporated | Screening for neurological disease using speech articulation characteristics |
JP6639285B2 (ja) * | 2016-03-15 | 2020-02-05 | 株式会社東芝 | 声質嗜好学習装置、声質嗜好学習方法及びプログラム |
-
2018
- 2018-04-13 CN CN201810329076.7A patent/CN108520759B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622331A (zh) * | 2012-02-10 | 2012-08-01 | 程涛 | 一种基于压缩感知的高斯矩阵优化方法 |
CN105448291A (zh) * | 2015-12-02 | 2016-03-30 | 南京邮电大学 | 基于语音的帕金森症检测方法及检测系统 |
CN107862060A (zh) * | 2017-11-15 | 2018-03-30 | 吉林大学 | 一种追踪目标人的语义识别装置及识别方法 |
Non-Patent Citations (6)
Title |
---|
A two-stage variable selection and classification approach for Parkinson"s disease detection by using voice recording replications;Lizbeth Naranjo,Jacinto Martín;《Computer Methods and Programs in Biomedicine》;20170430;第147-156页 * |
Classification of Parkinson’s disease utilizing multi-edit nearest-neighbor and ensemble learning algorithms with speech samples;He‑Hua Zhang1, Liuyang Yang2, Yuchuan Liu,Pin Wang,et al;《BioMedical Engineering OnLine》;20161116;第1-22页 * |
Generating Intelligible Audio Speech From Visual Speech;Thomas Le Cornu,Ben Milner;《IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》;20170930;第25卷(第9期);第1751-1761页 * |
一种改进动态特征参数的话者语音识别系统;申小虎,万荣春,张新野;《计算机仿真》;20150430;第32卷(第4期);第154-158页 * |
基于SPWD 时频脊特征提取的汉语声调识别;徐郑丹,于凤芹;《计算机应用与软件》;20140331;第31卷(第3期);第142-145页 * |
老年人教育背景、年龄对言语流畅性的影响;胡云霄;《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》;中国学术期刊(光盘版)电子杂志社;20171015(第10期);第F102-27页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108520759A (zh) | 2018-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108520759B (zh) | 用于帕金森病语音检测的时频特征图像提取方法 | |
US11961533B2 (en) | Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments | |
CN108198545B (zh) | 一种基于小波变换的语音识别方法 | |
CN110570880B (zh) | 一种鼾声信号识别方法 | |
Kapoor et al. | Parkinson’s disease diagnosis using Mel-frequency cepstral coefficients and vector quantization | |
CN111291614A (zh) | 基于迁移学习多模型决策融合的儿童癫痫综合症分类方法 | |
Winursito et al. | Feature data reduction of MFCC using PCA and SVD in speech recognition system | |
CN108564965B (zh) | 一种抗噪语音识别系统 | |
CN114613389A (zh) | 一种基于改进mfcc的非语音类音频特征提取方法 | |
CN112542174A (zh) | 基于vad的多维特征参数声纹识别方法 | |
Fazel et al. | Sparse auditory reproducing kernel (SPARK) features for noise-robust speech recognition | |
CN113796889A (zh) | 一种基于深度学习的辅助电子听诊器信号判别方法 | |
CN111508504B (zh) | 基于听觉中枢感知机理的说话人识别方法 | |
CN101930733A (zh) | 一种用于语音情感识别的语音情感特征提取方法 | |
Saritha et al. | Enhancement in speaker recognition using SincNet through optimal window and frame shift | |
CN114822567B (zh) | 一种基于能量算子的病理嗓音频谱重构方法 | |
Salhi et al. | Robustness of auditory teager energy cepstrum coefficients for classification of pathological and normal voices in noisy environments | |
CN112309404B (zh) | 机器语音的鉴别方法、装置、设备及存储介质 | |
CN104064197A (zh) | 一种基于语音帧间动态信息提高语音识别鲁棒性的方法 | |
Li et al. | Learnable frequency filters for speech feature extraction in speaker verification | |
CN113948088A (zh) | 基于波形模拟的语音识别方法及装置 | |
Taoufiq et al. | Cepstral Coefficient Extraction using the MFCC with the Discrete Wavelet Transform for the Parkinson’s Disease Diagnosis | |
CN111816186A (zh) | 一种声纹识别的特征参数提取系统及方法 | |
Zhu et al. | A study of the robustness of raw waveform based speaker embeddings under mismatched conditions | |
Tian et al. | Application of wavelet in speech processing of cochlear implant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210511 |