CN114822567B - 一种基于能量算子的病理嗓音频谱重构方法 - Google Patents

一种基于能量算子的病理嗓音频谱重构方法 Download PDF

Info

Publication number
CN114822567B
CN114822567B CN202210707979.0A CN202210707979A CN114822567B CN 114822567 B CN114822567 B CN 114822567B CN 202210707979 A CN202210707979 A CN 202210707979A CN 114822567 B CN114822567 B CN 114822567B
Authority
CN
China
Prior art keywords
power spectrum
frequency
spectrum
pathological
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210707979.0A
Other languages
English (en)
Other versions
CN114822567A (zh
Inventor
张涛
刘赣俊
赵鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202210707979.0A priority Critical patent/CN114822567B/zh
Publication of CN114822567A publication Critical patent/CN114822567A/zh
Application granted granted Critical
Publication of CN114822567B publication Critical patent/CN114822567B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明提供了一种基于能量算子的病理嗓音频谱重构方法,包括病理嗓音信号基频自适应加窗、计算功率谱、重构功率谱、功率谱的频域平滑处理、计算功率倒频谱、同态滤波以及计算频谱包络。本发明公开的一种基于能量算子的病理嗓音频谱重构方法,改善了病理嗓音频谱分量过于分散的问题,能够有效提取嗓音的主要信息、频谱分量和峰值,获得重构的病理嗓音频谱包络,解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

Description

一种基于能量算子的病理嗓音频谱重构方法
技术领域
本发明属于信息技术领域,尤其是涉及一种基于能量算子的病理嗓音频谱重构方法。
背景技术
病理嗓音是指由于声带组织发生病变,声带张力变小,同时声道结构功能性改变导致声带不规则振动、声门出现高次谐波、信号周期性发生改变、幅度及其频率出现波动的嗓音。病理嗓音修复是嗓音障碍研究领域的一个新方向,旨在通过修复病理嗓音信号提高语音可懂度,通过非侵入式的语音信号处理技术修复病理嗓音,可以提高病理嗓音信号的清晰度和可懂度,帮助嗓音疾病患者体验更为便利的语音交互。
发声系统的数学模型分为激励、声道和辐射共三个子模型。嗓音疾病影响的发声器官对应的是激励模型和声道模型。对于激励模型,基频表征嗓音的音调高低,是激励模型中描述声带振动频率重要的特征参数。对于声道模型,共振峰的位置、宽度、幅度等是声道参数中影响元音音色的重要参数。对于整个发声系统而言,频谱包络可以勾勒整段语音的主要信息,同时包含频谱分量、峰值幅度等主要参数。
传统的激励模型提取算法虽然具有计算复杂度低的优点,但是在提取过程中会出现峰值突变,导致二次倍频和分频错误,提取声道参数时,对纯净嗓音信号检测有效,但是在计算复杂的滤除声道卷积信号时容易发生误差,存在传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。
发明内容
有鉴于此,本发明旨在提出一种基于能量算子的病理嗓音频谱重构方法,改善了病理嗓音频谱分量过于分散的问题,能够有效提取嗓音的主要信息、频谱分量和峰值,获得重构的病理嗓音频谱包络,解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于能量算子的病理嗓音频谱重构方法,包括:
步骤一: 病理嗓音信号基频自适应加窗:采用长度为mT 0 的汉宁窗w(n),对病理嗓音信号x(n)进行分段加窗,其中T 0 为病理嗓音信号x(n)的基音周期,m为大于零的整数,n为时域变量;
步骤二: 计算功率谱:计算步骤一中使用汉宁窗w(n)加窗的病理嗓音信号x(n)的功率谱
Figure 551083DEST_PATH_IMAGE001
,其中
Figure 920753DEST_PATH_IMAGE002
为角频率;
步骤三: 重构功率谱:进一步对功率谱
Figure 638173DEST_PATH_IMAGE001
进行非线性变换得到Teager能量算子
Figure 485913DEST_PATH_IMAGE003
,再对能量算子
Figure 628181DEST_PATH_IMAGE003
幅值归一化得到重构功率谱
Figure 653906DEST_PATH_IMAGE004
步骤四:功率谱的频域平滑处理:进一步通过一个的矩形窗,对重构功率谱
Figure 639048DEST_PATH_IMAGE004
进行频域平滑处理,得到平滑后的功率谱
Figure 1782DEST_PATH_IMAGE005
步骤五:计算功率倒频谱:计算功率谱
Figure 60874DEST_PATH_IMAGE006
的功率倒频谱
Figure 178871DEST_PATH_IMAGE007
步骤六:同态滤波:使用同态滤波函数对功率倒频谱
Figure 870884DEST_PATH_IMAGE007
进行平滑滤波和频谱恢复,得到同态滤波后的倒频谱
Figure 529267DEST_PATH_IMAGE008
步骤七:计算频谱包络:对倒频谱
Figure 849390DEST_PATH_IMAGE009
使用傅里叶逆变换得到重构的病理嗓音频谱包络
Figure 216917DEST_PATH_IMAGE010
相对于现有技术,本发明所述的一种基于能量算子的病理嗓音频谱重构方法,具有以下优势:
本发明公开了一种基于能量算子的病理嗓音频谱重构方法,改善了病理嗓音频谱分量过于分散的问题,能够有效提取嗓音的主要信息、频谱分量和峰值,获得重构的病理嗓音频谱包络,解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题,具有提取效果好,适用性强的特点。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
在附图中:
图1为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法流程示意图;
图2为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构前示意图;
图3为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构后示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,一种基于能量算子的病理嗓音频谱重构方法,包括:
步骤一: 病理嗓音信号基频自适应加窗:采用长度为mT 0 的汉宁窗w(n),对病理嗓音信号x(n)进行分段加窗,其中T 0 为病理嗓音信号x(n)的基音周期,m为大于零的整数,n为时域变量;
在本实施例中,病理嗓音信号x(n)选自MEEI语音库中元音/a/,每个元音采样率为8kHz,m=3,帧移为128。
步骤二: 计算功率谱:计算步骤一中使用汉宁窗w(n)加窗的病理嗓音信号x(n)的 功率谱
Figure 379914DEST_PATH_IMAGE001
,其中
Figure 858300DEST_PATH_IMAGE002
为角频率;
步骤三: 重构功率谱:进一步对功率谱
Figure 688722DEST_PATH_IMAGE001
进行非线性变换得到Teager能量算 子
Figure 961571DEST_PATH_IMAGE003
,再对能量算子
Figure 861132DEST_PATH_IMAGE003
幅值归一化得到重构功率谱
Figure 143209DEST_PATH_IMAGE004
步骤四:功率谱的频域平滑处理:进一步通过一个的矩形窗,对重构功率谱
Figure 234662DEST_PATH_IMAGE004
进行频域平滑处理,得到平滑后的功率谱
Figure 193259DEST_PATH_IMAGE005
步骤五:计算功率倒频谱:计算功率谱
Figure 347160DEST_PATH_IMAGE006
的功率倒频谱
Figure 823141DEST_PATH_IMAGE007
步骤六:同态滤波:使用同态滤波函数对功率倒频谱
Figure 893734DEST_PATH_IMAGE007
进行平滑滤波和频谱恢 复,得到同态滤波后的倒频谱
Figure 616708DEST_PATH_IMAGE011
步骤七:计算频谱包络:对倒频谱
Figure 772752DEST_PATH_IMAGE009
使用傅里叶逆变换得到重构的病理嗓音频 谱包络
Figure 52423DEST_PATH_IMAGE010
进一步的,在步骤二中:
Figure 993834DEST_PATH_IMAGE001
的计算过程如下:
Figure 435180DEST_PATH_IMAGE012
通过上述关系式,利用快速傅里叶变换可以得到功率谱
Figure 812941DEST_PATH_IMAGE013
,其中T 0 为病理嗓音 信号x(n)的基音周期,m为大于零的整数,n为时域变量。
进一步的,步骤三中:
对功率谱
Figure 974932DEST_PATH_IMAGE013
进行非线性变换得到Teager能量算子
Figure 754538DEST_PATH_IMAGE014
如下:
Figure 366785DEST_PATH_IMAGE015
Figure 982574DEST_PATH_IMAGE014
幅值归一化得到重构功率谱
Figure 463103DEST_PATH_IMAGE004
如下:
Figure 238161DEST_PATH_IMAGE016
其中,
Figure 552467DEST_PATH_IMAGE017
是Teager能量算子
Figure 655552DEST_PATH_IMAGE014
的最大值,
Figure 80718DEST_PATH_IMAGE018
是 Teager能量算子
Figure 834916DEST_PATH_IMAGE014
的最小值,
Figure 664332DEST_PATH_IMAGE002
为角频率。
进一步的,步骤四中,矩形窗宽度为
Figure 379347DEST_PATH_IMAGE019
,功率谱
Figure 201678DEST_PATH_IMAGE020
如下计算得到:
Figure 295536DEST_PATH_IMAGE021
其中
Figure 951645DEST_PATH_IMAGE022
Figure 419536DEST_PATH_IMAGE023
为中间变量,
Figure 45558DEST_PATH_IMAGE002
为角频率,m为大于零的整数。
进一步的,在步骤五中,因为周期为T 0 的时域信号的频谱是周期为
Figure 525081DEST_PATH_IMAGE024
的频域信号, 功率倒频谱
Figure 31321DEST_PATH_IMAGE025
如下计算得到:
Figure 330715DEST_PATH_IMAGE026
其中,
Figure 760429DEST_PATH_IMAGE027
是傅里叶逆变换,
Figure 750250DEST_PATH_IMAGE028
是倒频率。
进一步的,在步骤六中:
Figure 13741DEST_PATH_IMAGE029
如下计算得到:
Figure 925066DEST_PATH_IMAGE030
Figure 971519DEST_PATH_IMAGE031
Figure 894476DEST_PATH_IMAGE032
其中,同态滤波函数
Figure 532130DEST_PATH_IMAGE033
用于平滑信号,同态滤波函数
Figure 586543DEST_PATH_IMAGE034
用于频谱恢复,
Figure 967846DEST_PATH_IMAGE035
为基音频率,
Figure 276467DEST_PATH_IMAGE036
Figure 209657DEST_PATH_IMAGE037
为设定的参数,
Figure 439781DEST_PATH_IMAGE028
是倒频率。
在本实施例中,
Figure 218250DEST_PATH_IMAGE036
=1.18;
Figure 584641DEST_PATH_IMAGE037
=-0.09。
进一步的,在步骤七中,
Figure 423153DEST_PATH_IMAGE038
如下计算得到:
Figure 140573DEST_PATH_IMAGE039
其中,F是傅里叶逆变换,
Figure 722733DEST_PATH_IMAGE002
为角频率。
如图2以及图3所示,功率谱重构后信号能量集中于主要频谱分量,重构效果明显,信号特征明显好于重构前的病理嗓音信号,原本过于分散的频谱能量得以集中,重构后的频谱包络可以直接观察得到共振峰。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于能量算子的病理嗓音频谱重构方法,其特征在于:包括:
步骤一: 病理嗓音信号基频自适应加窗:采用长度为mT 0 的汉宁窗w(n),对病理嗓音信号x(n)进行分段加窗,其中T 0 为病理嗓音信号x(n)的基音周期,m为大于零的整数,n为时域变量;
步骤二: 计算功率谱:计算步骤一中使用汉宁窗w(n)加窗的病理嗓音信号x(n)的功率谱
Figure DEST_PATH_IMAGE002
,其中
Figure DEST_PATH_IMAGE004
为角频率;
Figure DEST_PATH_IMAGE002A
的计算过程如下:
Figure DEST_PATH_IMAGE006
通过上述关系式,利用快速傅里叶变换可以得到功率谱
Figure DEST_PATH_IMAGE008
,其中T 0 为病理嗓音信号x (n)的基音周期,m为大于零的整数,n为时域变量;
步骤三: 重构功率谱:进一步对功率谱
Figure DEST_PATH_IMAGE002AA
进行非线性变换得到Teager能量算子
Figure DEST_PATH_IMAGE010
,再对能量算子
Figure DEST_PATH_IMAGE010A
幅值归一化得到重构功率谱
Figure DEST_PATH_IMAGE012
对功率谱
Figure DEST_PATH_IMAGE008A
进行非线性变换得到Teager能量算子
Figure DEST_PATH_IMAGE014
如下:
Figure DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE018
幅值归一化得到重构功率谱
Figure DEST_PATH_IMAGE012A
如下:
Figure DEST_PATH_IMAGE020
其中,
Figure DEST_PATH_IMAGE022
是Teager能量算子
Figure DEST_PATH_IMAGE014A
的最大值,
Figure DEST_PATH_IMAGE024
是Teager能量算子
Figure DEST_PATH_IMAGE014AA
的最小值,
Figure DEST_PATH_IMAGE004A
为角频率;
步骤四:功率谱的频域平滑处理:进一步通过一个的矩形窗,对重构功率谱
Figure DEST_PATH_IMAGE012AA
进行频域平滑处理,得到平滑后的功率谱
Figure DEST_PATH_IMAGE026
矩形窗宽度为
Figure DEST_PATH_IMAGE028
,功率谱
Figure DEST_PATH_IMAGE030
如下计算得到:
Figure DEST_PATH_IMAGE032
其中
Figure DEST_PATH_IMAGE034
Figure DEST_PATH_IMAGE036
为中间变量,
Figure DEST_PATH_IMAGE004AA
为角频率,m为大于零的整数;
步骤五:计算功率倒频谱:计算功率谱
Figure DEST_PATH_IMAGE038
的功率倒频谱
Figure DEST_PATH_IMAGE040
步骤六:同态滤波:使用同态滤波函数对功率倒频谱
Figure DEST_PATH_IMAGE040A
进行平滑滤波和频谱恢复,得到同态滤波后的倒频谱
Figure DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE043
如下计算得到:
Figure DEST_PATH_IMAGE045
Figure DEST_PATH_IMAGE047
Figure DEST_PATH_IMAGE049
其中,同态滤波函数
Figure DEST_PATH_IMAGE051
用于平滑信号,同态滤波函数
Figure DEST_PATH_IMAGE053
用于频谱恢复,
Figure DEST_PATH_IMAGE055
为基音频率,
Figure DEST_PATH_IMAGE057
Figure DEST_PATH_IMAGE059
为设定的参数,
Figure DEST_PATH_IMAGE061
是倒频率;
步骤七:计算频谱包络:对倒频谱
Figure DEST_PATH_IMAGE062
使用傅里叶逆变换得到重构的病理嗓音频谱包络
Figure DEST_PATH_IMAGE064
2.根据权利要求1所述的一种基于能量算子的病理嗓音频谱重构方法,其特征在于:在步骤五中,功率倒频谱
Figure DEST_PATH_IMAGE066
如下计算得到:
Figure DEST_PATH_IMAGE068
其中,
Figure DEST_PATH_IMAGE070
是傅里叶逆变换,
Figure DEST_PATH_IMAGE061A
是倒频率。
3.根据权利要求1所述的一种基于能量算子的病理嗓音频谱重构方法,其特征在于:在步骤七中,
Figure DEST_PATH_IMAGE071
如下计算得到:
Figure DEST_PATH_IMAGE073
其中,F是傅里叶逆变换,
Figure DEST_PATH_IMAGE004AAA
为角频率。
CN202210707979.0A 2022-06-22 2022-06-22 一种基于能量算子的病理嗓音频谱重构方法 Active CN114822567B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210707979.0A CN114822567B (zh) 2022-06-22 2022-06-22 一种基于能量算子的病理嗓音频谱重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210707979.0A CN114822567B (zh) 2022-06-22 2022-06-22 一种基于能量算子的病理嗓音频谱重构方法

Publications (2)

Publication Number Publication Date
CN114822567A CN114822567A (zh) 2022-07-29
CN114822567B true CN114822567B (zh) 2022-09-27

Family

ID=82521912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210707979.0A Active CN114822567B (zh) 2022-06-22 2022-06-22 一种基于能量算子的病理嗓音频谱重构方法

Country Status (1)

Country Link
CN (1) CN114822567B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294970B (zh) * 2022-10-09 2023-03-24 苏州大学 针对病理嗓音的语音转换方法、装置和存储介质
CN117975982B (zh) * 2024-04-01 2024-06-04 天津大学 一种基于g-lpc的病理嗓音增强方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103474066A (zh) * 2013-10-11 2013-12-25 福州大学 基于多频带信号重构的生态声音识别方法
CN104089699A (zh) * 2014-06-20 2014-10-08 国家电网公司 一种变电站设备声音重建算法
CN109036472A (zh) * 2018-07-19 2018-12-18 天津大学 一种改进的病理嗓音基音频率提取方法
CN110353685A (zh) * 2012-03-29 2019-10-22 昆士兰大学 用于处理患者声音的方法与装置
CN110534120A (zh) * 2019-08-31 2019-12-03 刘秀萍 一种移动网络环境下的环绕声误码修复方法
CN111640439A (zh) * 2020-05-15 2020-09-08 南开大学 一种基于深度学习的呼吸音分类方法
CN112820315A (zh) * 2020-07-13 2021-05-18 腾讯科技(深圳)有限公司 音频信号处理方法、装置、计算机设备及存储介质
CN114203196A (zh) * 2021-11-30 2022-03-18 山东大学 一种基于毫米波信号的音频重建方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2364401B2 (es) * 2011-06-27 2011-12-23 Universidad Politécnica de Madrid Método y sistema para la estimación de parámetros fisiológicos de la fonación.
EP3367908B1 (en) * 2015-10-30 2020-09-23 The Johns Hopkins University Programmable electronic stethoscope devices, algorithms, systems, and methods
CN112562650A (zh) * 2020-10-31 2021-03-26 苏州大学 一种基于声带特征参数的语音识别分类方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110353685A (zh) * 2012-03-29 2019-10-22 昆士兰大学 用于处理患者声音的方法与装置
CN103474066A (zh) * 2013-10-11 2013-12-25 福州大学 基于多频带信号重构的生态声音识别方法
CN104089699A (zh) * 2014-06-20 2014-10-08 国家电网公司 一种变电站设备声音重建算法
CN109036472A (zh) * 2018-07-19 2018-12-18 天津大学 一种改进的病理嗓音基音频率提取方法
CN110534120A (zh) * 2019-08-31 2019-12-03 刘秀萍 一种移动网络环境下的环绕声误码修复方法
CN111640439A (zh) * 2020-05-15 2020-09-08 南开大学 一种基于深度学习的呼吸音分类方法
CN112820315A (zh) * 2020-07-13 2021-05-18 腾讯科技(深圳)有限公司 音频信号处理方法、装置、计算机设备及存储介质
CN114203196A (zh) * 2021-11-30 2022-03-18 山东大学 一种基于毫米波信号的音频重建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PVR-AFM: A Pathological Voice Repair System based on Non-linear Structure;Tao Zhang etc;《Journal of Voice》;20210705;第1-15页 *
基于EEMD的病态嗓音特征提取研究;喻春霞;《中国优秀博硕士学位论文全文数据库(硕士)》;20190415(第04期);第37-46页 *

Also Published As

Publication number Publication date
CN114822567A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN114822567B (zh) 一种基于能量算子的病理嗓音频谱重构方法
US6862558B2 (en) Empirical mode decomposition for analyzing acoustical signals
Sharma et al. Empirical mode decomposition for adaptive AM-FM analysis of speech: A review
EP1005021B1 (en) Method and apparatus to extract formant-based source-filter data for coding and synthesis employing cost function and inverse filtering
US20210193149A1 (en) Method, apparatus and device for voiceprint recognition, and medium
US20120150544A1 (en) Method and system for reconstructing speech from an input signal comprising whispers
US20150154980A1 (en) Cepstral separation difference
CN102201240B (zh) 基于逆滤波的谐波噪声激励模型声码器
Pravena et al. Pathological voice recognition for vocal fold disease
CN110942784A (zh) 基于支持向量机的鼾声分类系统
US6701291B2 (en) Automatic speech recognition with psychoacoustically-based feature extraction, using easily-tunable single-shape filters along logarithmic-frequency axis
CN105845126A (zh) 一种英语有声影像资料自动加注英语字幕的方法
Ghitza Robustness against noise: The role of timing-synchrony measurement
WO2002065157A2 (en) Empirical mode decomposition for analyzing acoustical signals
CN112820319A (zh) 一种人类鼾声识别方法及其装置
CN110415824B (zh) 脑卒中风的患病风险评估装置和设备
Zhang et al. PVR-AFM: A pathological voice repair system based on non-linear structure
CN109300486B (zh) 基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法
Chennupati et al. Spectral and temporal manipulations of SFF envelopes for enhancement of speech intelligibility in noise
Katsir et al. Evaluation of a speech bandwidth extension algorithm based on vocal tract shape estimation
Dubey et al. Pitch-Adaptive Front-end Feature for Hypernasality Detection.
CN109036472B (zh) 一种改进的病理嗓音基音频率提取方法
CN114913844A (zh) 一种基音归一化重构的广播语种识别方法
Nasreen et al. Speech analysis for automatic speech recognition
Zhang et al. Acoustic characteristics of normal and pathological voices analysis and recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant