CN110176245A - 一种语音降噪系统 - Google Patents
一种语音降噪系统 Download PDFInfo
- Publication number
- CN110176245A CN110176245A CN201910454430.3A CN201910454430A CN110176245A CN 110176245 A CN110176245 A CN 110176245A CN 201910454430 A CN201910454430 A CN 201910454430A CN 110176245 A CN110176245 A CN 110176245A
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- module
- noising
- speech processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003321 amplification Effects 0.000 claims abstract description 21
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 21
- 230000009467 reduction Effects 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 238000009432 framing Methods 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 3
- 210000000056 organ Anatomy 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 238000013178 mathematical model Methods 0.000 abstract description 12
- 238000011946 reduction process Methods 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种语音降噪系统,属于噪声消除领域,其技术方案要点是,包括语音采集模块,语音放大模块,与语音采集模块连接,语音处理模块,通过语音采集模块与语音放大模块连接,语音处理模块对输入语音信息进行处理并提取特征信息;根据特征信息建立信息数字模型;语音降噪模块,分别与语音放大模块、语音处理模块连接,语音降噪模块基于特征信息数字模型对待处理语音信号进行降噪。语音处理模块对输入语音信息进行处理并提取语音特征信息以建立信息数字模型,语音信息数字模型能够进行模拟语音信号,实现语音降噪模块能够基于特征信息数字模型对待处理语音信号进行降噪,解决了在降噪过程中,容易出现语音丢字或者波形失真的问题。
Description
技术领域
本发明涉及噪声消除技术领域,具体而言,涉及一种语音降噪系统。
背景技术
随着手机等移动互联网终端以及网络音视频软件的广泛应用,人与人之间可以越来越方便的实现随时随地的通话,鉴于通话环境的复杂性和多样性,人们在进行通话时也就越来越多地可能处于噪声环境之下,通话环境中的噪声对于通话质量的负面影响日益明显。比如在喧闹的街道、房间和广场中,又或者在汽车、火车等交通工具中,周围背景噪声对于通话双方的通话质量的负面影响有时会非常严重。而对于佩带耳机聆听音乐、观赏电影或进行电玩游戏的便携多媒体数码设备使用者,噪声对于用户的使用体验的负面影响则会更加让人无法忍受。
现有技术中,各种降噪设备能够从噪声背景中提取有用的语音信号,抑制、降低噪声干扰,但是随着信噪比的减小,降噪方法处理的效果也随之变差,容易出现语音丢字或者波形失真的问题,从而降低了语音识别率。
因此,有必要提出一种新的语音降噪系统方案以解决现有技术中信噪比小时,语音识别率低的问题。
发明内容
为了实现上述目的,本发明提供了一种语音降噪系统,包括语音采集模块,语音放大模块,与语音采集模块连接,用于增强输入的语音信号,以使高效率、低失真地重现语音输入信号;语音处理模块,通过语音采集模块与语音放大模块连接,以使接收增强后的输入语音信号,所述语音处理模块对输入语音信息进行处理并提取特征信息;根据所述特征信息建立信息数字模型;语音降噪模块,分别与语音放大模块、语音处理模块连接,所述语音降噪模块基于特征信息数字模型对待处理语音信号进行降噪,以使输出噪声消除的语音。
进一步地,所述语音降噪模块为负反馈闭环系统,通过利用前一刻已获得的信号参数,自动调节当前信号参数,以适应信号和噪声未知的或随机变化的统计特性,所述语音处理模块的输入输出闭环关系式为:
e(n)=d(n)-y(n)
其中,d(n)为期望信号,e(n)为误差信号,y(n)为输出信号;
wi为权系数,当权系数最优时,误差信号为最小。
进一步地,所述语音采集模块包括第一语音采集模块,用于采集环境内全部语音信号,第二语音采集模块,用于选取放大后的部分语音信号。
进一步地,所述语音处理模块用于对输入语音信号进行预加重、分帧和加窗等处理操作,消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等因素。
进一步地,所述语音处理模块还包括特征提取单元,用于提取处理后语音信号的特征信息,以生成表征语音信号中携带的说话人信息的特征参数。
进一步地,所述语音放大模块包括前置放大单元,以使接收微弱电信号,和功率放大单元,以使微弱电信号进行放大。
应用本发明的技术方案,有益效果是:该种语音降噪系统,通过语音处理模块对输入语音信息进行处理并提取语音特征信息以建立信息数字模型,语音信息数字模型能够进行模拟语音信号,实现语音降噪模块能够基于特征信息数字模型对待处理语音信号进行降噪,使得语音信号加强,从而在信噪比小的情况下,能够提高语音识别率,解决了在降噪过程中,容易出现语音丢字或者波形失真的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明的一种语音降噪系统的工作原理图;
图2示出了本发明的一种语音降噪系统的S10工作流程图;
图3示出了本发明的一种语音降噪系统的S20工作流程图;
图4示出了本发明的一种语音降噪系统的语音降噪模块识别框图;
图5示出了本发明的一种语音降噪系统的语音降噪模块结构图。
其中,上述附图包括以下附图标记:
12、第一语音采集模块;14、语音放大模块;16、语音降噪模块;22、第二语音采集模块;24、语音处理模块。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
如图1至图5所示,本发明提供了一种语音降噪系统,包括语音采集模块,语音放大模块,与语音采集模块连接,用于增强输入的语音信号,以使高效率、低失真地重现语音输入信号;语音处理模块,通过语音采集模块与语音放大模块连接,以使接收增强后的输入语音信号,语音处理模块对输入语音信息进行处理并提取特征信息;根据特征信息建立信息数字模型;语音降噪模块,分别与语音放大模块、语音处理模块连接,语音降噪模块基于特征信息数字模型对待处理语音信号进行降噪,以使输出噪声消除的语音。
应用本实施例的技术方案,语音放大模块与语音采集模块连接,使得语音放大模块能够将输入的语音信号加强,加强后的语音信号通过传输至语音降噪模块,从而对输入语音进行降噪处理,而且通过语音处理模块对输入语音信息进行处理并提取语音特征信息以建立信息数字模型,语音信息数字模型能够进行模拟语音信号,实现语音降噪模块能够基于特征信息数字模型对待处理语音信号进行降噪,使得语音信号加强,从而在信噪比小的情况下,能够提高语音识别率,解决了在降噪过程中,容易出现语音丢字或者波形失真的问题。
如图4所示,语音降噪模块为负反馈闭环系统,通过利用前一刻已获得的信号参数,自动调节当前信号参数,以适应信号和噪声未知的或随机变化的统计特性,语音处理模块的输入输出闭环关系式为:
e(n)=d(n)-y(n)
其中,d(n)为期望信号,e(n)为误差信号,y(n)为输出信号;
wi为权系数,当权系数最优时,误差信号为最小。
可见,系统参数能够随着输入信号的变化进行自动调整,不需要提前估计信号与噪声的参数,实现对信号的自适应滤波,根据输入信号的特性自适应调整滤波的系数,实现最优滤波,从而有效地提高降噪效果。
针对语音采集模块的具体结构,如图1所示,语音采集模块包括第一语音采集模块,用于采集环境内全部语音信号,第二语音采集模块,用于选取放大后的部分语音信号,通过第二语音采集模块对放大后的语音信号部分选取,能够加快语音处理模块的处理速度,从而有效地提高了特征信息提取的速度。
具体地,语音处理模块用于对输入语音信号进行预加重、分帧和加窗等处理操作,消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等因素,通过语音处理模块对输入的语音信号进行预加重、分帧和加窗等处理操作,能够使得后续语音处理得到的信号更均匀、平滑,为信号参数提取提供优质的参数,有效地提高了语音处理质量。
其中,语音处理模块还包括特征提取单元,用于提取处理后语音信号的特征信息,以生成表征语音信号中携带的说话人信息的特征参数。
针对语音放大模块的具体结构,语音放大模块包括前置放大单元,以使接收微弱电信号,和功率放大单元,以使微弱电信号进行放大,能够增强语音信号,从而提高信噪比,实现增加语音信号与噪声的区分度。
从以上的描述中,可以看出,本发明上述的实施例具体的使用方法及工作原理如下:首先,语音放大模块与第一语音采集模块连接,使得语音放大模块能够将输入的语音信号加强,加强后的语音信号通过传输至语音降噪模块,从而对输入语音进行降噪处理,接着,同时被放大的语音信号被第二语音采集模块部分收集,语音处理模块对部分放大后的输入语音信息进行处理并提取语音特征信息以建立信息数字模型,语音信息数字模型能够进行模拟语音信号,实现语音降噪模块能够基于特征信息数字模型对待处理语音信号进行降噪。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种语音降噪系统,其特征在于:包括
语音采集模块,
语音放大模块,与语音采集模块连接,用于增强输入的语音信号,以使高效率、低失真地重现语音输入信号;
语音处理模块,通过语音采集模块与语音放大模块连接,以使接收增强后的输入语音信号,所述语音处理模块对输入语音信息进行处理并提取特征信息;
根据所述特征信息建立信息数字模型;
语音降噪模块,分别与语音放大模块、语音处理模块连接,所述语音降噪模块基于特征信息数字模型对待处理语音信号进行降噪,以使输出噪声消除的语音。
2.根据权利要求1所述的一种语音降噪系统,其特征在于:所述语音降噪模块为负反馈闭环系统,通过利用前一刻已获得的信号参数,自动调节当前信号参数,以适应信号和噪声未知的或随机变化的统计特性,所述语音处理模块的输入输出闭环关系式为:
e(n)=d(n)-y(n)
其中,d(n)为期望信号,e(n)为误差信号,y(n)为输出信号;
wi为权系数,当权系数最优时,误差信号为最小。
3.根据权利要求1所述的一种语音降噪系统,其特征在于:所述语音采集模块包括第一语音采集模块,用于采集环境内全部语音信号,第二语音采集模块,用于选取放大后的部分语音信号。
4.根据权利要求1所述的一种语音降噪系统,其特征在于:所述语音处理模块用于对输入语音信号进行预加重、分帧和加窗等处理操作,消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等因素。
5.根据权利要求1-4中任一所述的一种语音降噪系统,其特征在于:所述语音处理模块还包括特征提取单元,用于提取处理后语音信号的特征信息,以生成表征语音信号中携带的说话人信息的特征参数。
6.根据权利要求5所述的一种语音降噪系统,其特征在于:所述语音放大模块包括前置放大单元,以使接收微弱电信号,和功率放大单元,以使微弱电信号进行放大。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910454430.3A CN110176245A (zh) | 2019-05-29 | 2019-05-29 | 一种语音降噪系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910454430.3A CN110176245A (zh) | 2019-05-29 | 2019-05-29 | 一种语音降噪系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110176245A true CN110176245A (zh) | 2019-08-27 |
Family
ID=67695850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910454430.3A Pending CN110176245A (zh) | 2019-05-29 | 2019-05-29 | 一种语音降噪系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110176245A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110648680A (zh) * | 2019-09-23 | 2020-01-03 | 腾讯科技(深圳)有限公司 | 语音数据的处理方法、装置、电子设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150371658A1 (en) * | 2014-06-19 | 2015-12-24 | Yang Gao | Control of Acoustic Echo Canceller Adaptive Filter for Speech Enhancement |
CN107293289A (zh) * | 2017-06-13 | 2017-10-24 | 南京医科大学 | 一种基于深度卷积生成对抗网络的语音生成方法 |
CN109326301A (zh) * | 2017-07-27 | 2019-02-12 | 哈曼贝克自动系统股份有限公司 | 自适应后滤波 |
CN109481146A (zh) * | 2018-10-29 | 2019-03-19 | 南京航空航天大学 | 一种配适不同物理隔音结构的主动降噪耳罩及方法 |
CN109524020A (zh) * | 2018-11-20 | 2019-03-26 | 上海海事大学 | 一种语音增强处理方法 |
CN109671433A (zh) * | 2019-01-10 | 2019-04-23 | 腾讯科技(深圳)有限公司 | 一种关键词的检测方法以及相关装置 |
-
2019
- 2019-05-29 CN CN201910454430.3A patent/CN110176245A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150371658A1 (en) * | 2014-06-19 | 2015-12-24 | Yang Gao | Control of Acoustic Echo Canceller Adaptive Filter for Speech Enhancement |
CN107293289A (zh) * | 2017-06-13 | 2017-10-24 | 南京医科大学 | 一种基于深度卷积生成对抗网络的语音生成方法 |
CN109326301A (zh) * | 2017-07-27 | 2019-02-12 | 哈曼贝克自动系统股份有限公司 | 自适应后滤波 |
CN109481146A (zh) * | 2018-10-29 | 2019-03-19 | 南京航空航天大学 | 一种配适不同物理隔音结构的主动降噪耳罩及方法 |
CN109524020A (zh) * | 2018-11-20 | 2019-03-26 | 上海海事大学 | 一种语音增强处理方法 |
CN109671433A (zh) * | 2019-01-10 | 2019-04-23 | 腾讯科技(深圳)有限公司 | 一种关键词的检测方法以及相关装置 |
Non-Patent Citations (1)
Title |
---|
柏东冰: "矿井工作面噪声分析及降噪算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110648680A (zh) * | 2019-09-23 | 2020-01-03 | 腾讯科技(深圳)有限公司 | 语音数据的处理方法、装置、电子设备及可读存储介质 |
CN110648680B (zh) * | 2019-09-23 | 2024-05-14 | 腾讯科技(深圳)有限公司 | 语音数据的处理方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10811030B2 (en) | System and apparatus for real-time speech enhancement in noisy environments | |
CN108712703B (zh) | 低功耗的高效降噪耳机及降噪系统 | |
CN101669284A (zh) | 移动音频装置的自动音量及动态范围调整 | |
CN101668085B (zh) | 一种调节移动终端语音输出的方法及移动终端 | |
US8504360B2 (en) | Automatic sound recognition based on binary time frequency units | |
US20240079021A1 (en) | Voice enhancement method, apparatus and system, and computer-readable storage medium | |
CN107371079B (zh) | 一种耳机的双麦克降噪系统及降噪方法 | |
US20020172350A1 (en) | Method for generating a final signal from a near-end signal and a far-end signal | |
CN106887239A (zh) | 用于高度相关的混合物的增强型盲源分离算法 | |
CN102223428A (zh) | 一种降低噪声的方法及移动终端 | |
CN115482830B (zh) | 语音增强方法及相关设备 | |
CN102111468A (zh) | 降噪通话手机及其方法 | |
WO2022142984A1 (zh) | 语音处理方法、装置、系统、智能终端以及电子设备 | |
CN106303761B (zh) | 一种窗口对讲系统及对讲方法 | |
CN117480554A (zh) | 语音增强方法及相关设备 | |
CN110176245A (zh) | 一种语音降噪系统 | |
CN211792016U (zh) | 降噪语音设备及电子设备 | |
CN112349291A (zh) | 基于ai降噪模型的扩声系统及方法 | |
CN111182416B (zh) | 处理方法、装置及电子设备 | |
CN201708849U (zh) | 一种具有助听功能的手机 | |
CN204119309U (zh) | 一种基于噪声估计自动调整通话音量的手机 | |
CN201956058U (zh) | 一种语音信号处理电路、装置以及电视 | |
CN105827618A (zh) | 改善碎片化异步会议系统通话质量的方法 | |
CN210629614U (zh) | 一种用于机内通话器的语音降噪处理器 | |
CN116600054A (zh) | 基于单线传输的门禁双端对讲方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190827 |