CN1293533C

CN1293533C - 一种用于口吃矫正的语音信号处理方法

Info

Publication number: CN1293533C
Application number: CNB2004100227505A
Authority: CN
Inventors: 蒋涛; 付晓毅; 夏世雄; 蒋一宁; 陈志刚; 蔺君刚
Original assignee: SICHUAN WEIDI DIGITAL TECHNOLOGY Co Ltd
Current assignee: SICHUAN WEIDI DIGITAL TECHNOLOGY Co Ltd
Priority date: 2004-06-09
Filing date: 2004-06-09
Publication date: 2007-01-03
Anticipated expiration: 2024-06-09
Also published as: CN1584978A

Abstract

本发明公开了一种用于口吃矫正的语音信号处理方法，属于一种语音信号处理技术。本发明由计算机CPU和音频处理器构成数字信号处理器，将音频接收装置和声音还原装置与音频处理器连接；音频接收装置将采集到的语音信号输入到音频处理器，通过延迟听觉反馈将音频处理器从音频接收装置获得的语音数据流进行延迟处理，处理后的数字信号输出到声音还原装置，由声音还原装置将其转换为语音信号供用户接听，从而可用于口吃矫正。通过本发明获得的语音信号，使使用者能够极大地改善大脑的左、右半球的交流状态，促进言语的流利程度，有效地减轻口吃现象。

Description

一种用于口吃矫正的语音信号处理方法

技术领域

本发明属于一种语音信号处理技术，对语音信号进行延迟听觉反馈处理，适用于口吃矫正或辅助治疗。

背景技术

目前，世界上有6千万口吃患者。口吃是一种心因性语言障碍症，易发于幼童时期，一般来说症状随着年龄的增长逐渐而加重，妨碍了患者与他人的交流，造成其学习、沟通能力下降，严重影响其人生的发展。从医学上讲，对于口吃患者目前尚不能用常规的药物、手术、训练等传统方法治愈这一疾病。传统帮助口吃障碍者的办法主要是心理引导、语言训练，但都不能从根本上解决问题。经研究结果表明，通过数字延迟听觉反馈和频率变换反馈处理后可直接并强有力地改善大脑的左、右半球的交流状态，促进言语的流利程度。通过延迟听觉反馈，口吃症状能减轻70-80％，通过对延迟听觉反馈和频率改变参数的调整，口吃现象能减轻80-90％。

准确地讲，严重的口吃患者在延迟听觉反馈的治疗中比轻微的口吃患者的语言流利程度得到了更大的提高，研究表明，经检验了延迟听觉反馈的微分反应后，显示出适当的延迟听觉反馈处理将最大程度地减轻口吃。

发明内容

本发明旨在针对现有口吃矫正方法及其设备的不足，提供一种语音信号处理方法，通过数字信号处理器对语音信号进行延迟听觉反馈处理，适用于口吃矫正或辅助治疗。

本发明把从外界接收到的声音信号进行实时的数字信号处理，然后将处理后的信号输出到声音还原装置供用户接听，从而可用于口吃矫正。通过本发明获得的语音信号，使使用者能够极大地改善大脑的左、右半球的交流状态，促进言语的流利程度，有效地减轻口吃现象。

为实现上述目的，本发明采用的技术方案如下：

一种用于口吃矫正的语音信号处理方法，其特征在于：该方法的步骤为：

a、由计算机CPU和音频处理器构成数字信号处理器，将音频接收装置和声音还原装置与音频处理器连接；

b、所述音频接收装置将采集到的语音模拟信号输入到音频处理器，通过延迟听觉反馈将音频处理器从音频接收装置获得的语音数字信号进行延迟处理，处理后的语音数字信号输出到声音还原装置，由声音还原装置将其转换为语音模拟信号。

所述从音频接收装置输入的语音模拟信号经过A/D模数转换为语音数字信号，该语音数字信号经上述延迟听觉反馈处理，经延迟处理后获得的语音数字信号经过时域/频域转换为系统所需的语音的频域数据，语音的频域数据经频率变换反馈处理、噪声处理、自动增益控制处理，通过频域/时域转换为语音的时域数据，再输出到输入/输出装置，再通过D/A转换为语音模拟信号后输出到声音还原装置。

所述延迟听觉反馈处理过程是：采用延时滤波器对给定的语音数字信号进行控制，用延时滤波器对给定的语音的频域数据进行控制；在延迟指定时间后输出延迟听觉反馈信号。

所述时域/频域转换处理过程是：采用输入管理器对语音数字信号进行列队，并采用迭加DFT滤波器组处理语音数字信号队列，将语音数字信号从语音的时域数据转变成语音的频域数据，经过DFT运算，语音数字信号队列中每2N点数字信号被计算为N个频率段的实部和虚部数据，即输入的语音数字信号被分解为N个频率段的频域数据。

所述噪声处理过程是：产生多通道混噪语音的频域信号，分别对各通道进行特征提取，然后进行信号识别和处理；该噪声处理是基于多通道技术，利用谱相减法，对有语音存在的通道予以放大，而对只有噪音存在的通道不予放大，达到通过混噪语音信号中的言语成分来提高言语可懂度。

所述自动增益控制过程是：利用一个多频段依从输入放大控制器，采用自动增益控制或宽动态范围压缩，将输入的语音数字信号经过分解滤波器组、通道处理、合成滤波器组进行放大输出。

所述频率变换反馈处理过程是：采用频率变换滤波器对给定的语音的频域数据，根据频率与声强的关系，按指定的改变函数进行不同频率的移动和叠加，输出频率变换反馈信号。

所述频域/时域转换过程是时域/频域转换的逆过程，采用迭加DFT滤波器组处理语音的频域数据，将频域转变成信号时域信号，采用输出管理器输出语音的时域信号进行队列。

本发明采用的计算机为台式计算机、笔记本计算机、掌上计算机或个人数字助理PDA，包含中央处理器、存储器、输入设备、输出设备的计算机具。

所述音频处理器为计算机内置声卡、外置声卡，或其它可联结在计算机上的音频处理装置。

所述音频接收装置是一种将声音信号转换为电信号的能量变换装置，包括电磁式话筒、电容式话筒、驻极体话筒、压电式话筒。

所述声音还原装置是一种将电信号转换为声音信号的能量的变换装置，包括是扬声器、耳机、听筒。

所述计算机CPU控制音频处理器的输入、输出和运算。

本发明的优点在于：

本发明对输入的语音模拟信号进行数字延迟听觉反馈和频率变换反馈等处理，使使用者可直接并强有力改善大脑左、右半球的交流状态，促进言语的流利程度，严重口吃患者通过延迟听觉反馈的治疗，通过对延迟听觉反馈和频率变换反馈参数的调整，口吃现象能减轻80-.90％。本方法实施简单、方便，口吃患者可以方便地在计算机上使用本发明使口吃得到矫正。

附图说明

图1为本发明采用的系统构架原理框图

图2为本发明流程逻辑框图

具体实施方式

实施例1

一种用于口吃矫正的语音信号处理方法，该方法采用麦克风、耳机、数字信号处理器，所述数字信号处理器为计算机CPU、音频处理器(声卡)。计算机CPU控制音频处理器的输入、输出和运算。见图1。

所述音频处理过程包括延迟听觉反馈处理、时域/频域转换处理、噪声处理、自动增益控制、频率变换反馈处理、频域/时域转换处理。见图2。

所述延迟听觉反馈处理过程是：采用延时滤波器对给定的语音数字信号进行控制，在延迟指定时间后输出延迟听觉反馈信号。该延迟时间可以任意调整，精度要求在1ms以上。

所述时域/频域转换处理过程是：采用输入管理器对语音数字信号进行列队，并采用迭加DFT滤波器组处理语音数字信号队列，将语音数字信号从语音的时域数据转变成语音的频域数据。本发明利用上述滤波器组把输入信号分解为N个频率段，经过DFT运算，语音数字信号队列中每2N点数字信号被计算为N个频率段的实部和虚部数据，即输入的语音数字信号被分解为N个频率段的频域数据。

所述自动增益控制过程是：利用一个多频段(通道)依从输入放大控制器，采用自动增益控制(AGCi或Ai＝}C0)或宽动态范围压缩(WDRC)，将输入的语音数字信号经过分解滤波器组、通道处理、合成滤波器组进行放大输出。

所述频域/时域转换过程是时域/频域转换的逆过程。采用迭加DFT滤波器组处理语音的频域数据，将频域信号转变成时域信号，采用输出管理器输出语音的时域信号队列。

本发明的原理及操作过程是：

麦克风将使用者的语音模拟信号变为电平信号输入到音频处理器的输入接口(麦克风接口)，经A/D转换为语音数字信号，该语音数字信号经延迟听觉反馈模块的延迟听觉反馈后，通过时域/频域转换模块进行重构，转换为系统所需的语音的频域数据，语音的频域数据经频率变换反馈模块、噪声处理模块、自动增益控制器对语音的频域数据进行频率变换反馈、降噪、音量控制，分频段可编程放大等优化处理，再由频域/时域转换模块输出到输入/输出装置，通过D/A转换后由输出端口输出到声音还原装置(耳机或扬声器)。以上重构和处理的参数可以通过计算机人机界面调整，由使用者进行控制，并可实时观察到调整的结果，以方便使用者调节最适宜的参数，最大程度地发挥本系统的作用。这样，使用者通过人机界面选择适当的参数，然后在对着麦克风说话的过程中，从耳机中听到经过重构和处理后说话声，从而完成听觉延迟反馈和频率变换反馈，达到矫正口吃或者辅助治疗口吃的目的。

实施例2

一种利用计算机进行口吃矫正的口吃矫正装置，该装置由麦克风、耳机、数字信号处理器构成，所述数字信号处理器为个人数字助理PDA，内置声卡。

本发明的原理及操作过程是：

麦克风将使用者的语音模拟信号变为电平信号输入到个人数字助理PDA的麦克风接口。个人数字助理PDA获取由麦克风接口转换得到的语音数字信号并实时进行处理和控制，通过信号重构实现听觉延迟反馈和频率变换反馈，并进一步对信号进行降噪、音量控制，分频段可编程放大等优化处理。以上重构和处理的参数可以通过个人数字助理PDA的人机界面调整，由使用者进行控制，并可实时观察到调整的结果，以方便使用者调节最适宜的参数，最大程度地发挥本系统的作用。经重构和处理后的语音信号数据流通过输出到PDA的输出接口，然后输出到耳机。这样，使用者通过应用程序的人机界面选择适当的参数，然后在对着麦克风说话的过程中，从耳机中听到经过重构和处理后说话声，从而完成听觉延迟反馈和频率变换反馈，达到矫正口吃或者辅助治疗口吃的目的。

Claims

1、一种用于口吃矫正的语音信号处理方法，其特征在于：该方法的步骤为：

b、所述音频接收装置将采集到的语音模拟信号输入到音频处理器，该语音模拟信号经过A/D模数转换为语音数字信号，通过延迟听觉反馈将语音数字信号进行延迟处理，经延迟处理后获得的语音数字信号经过时域/频域转换为系统所需的语音的频域数据，语音的频域数据经频率变换反馈处理、噪声处理、自动增益控制处理后，通过频域/时域转换为语音的时域数据，再输出到输入/输出装置，通过D/A转换为语音模拟信号后输出到声音还原装置。

2、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：所述延迟听觉反馈处理过程是：采用延时滤波器对给定的语音数字信号进行控制，在延迟指定时间后输出延迟听觉反馈信号。

3、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：所述时域/频域转换处理过程是：采用输入管理器对语音数字信号进行列队，并采用迭加DFT滤波器组处理语音数字信号队列，将语音数字信号从语音的时域数据转变成语音的频域数据，经过DFT运算，语音数字信号队列中每2N点数字信号被计算为N个频率段的实部和虚部数据，即输入的语音数字信号被分解为N个频率段的频域数据。

4、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：所述噪声处理过程是：产生多通道混噪语音的频域信号，分别对各通道进行特征提取，然后进行信号识别和处理。

5、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：所述自动增益控制过程是：利用一个多通道段依从输入放大控制器，采用自动增益控制或宽动态范围压缩，将输入的语音数字信号经过分解滤波器组、通道处理、合成滤波器组进行放大输出。

6、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：所述频率变换反馈处理过程是：采用频率变换滤波器针对给定的语音的频域数据，根据频率与声强的关系，按指定的改变函数进行不同频率的移动和叠加，输出频率变换反馈信号。

7、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：所述频域/时域转换过程是时域/频域转换的逆过程，采用迭加DFT滤波器组处理语音的频域数据，将频域信号转变成时域信号，采用输出管理器输出语音的时域信号队列。

8、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：本发明采用的计算机为台式计算机、笔记本计算机、掌上计算机或个人数字助理PDA，包含中央处理器、存储器、输入设备、输出设备的计算机具。

9、根据权利要求1所述的一种用于口吃矫正的语音信号处理方法，其特征在于：所述音频处理器为计算机内置声卡、外置声卡，或其它可联结在计算机上的音频处理装置。