CN108172220A - 一种新型语音除噪方法 - Google Patents

一种新型语音除噪方法 Download PDF

Info

Publication number
CN108172220A
CN108172220A CN201810153082.1A CN201810153082A CN108172220A CN 108172220 A CN108172220 A CN 108172220A CN 201810153082 A CN201810153082 A CN 201810153082A CN 108172220 A CN108172220 A CN 108172220A
Authority
CN
China
Prior art keywords
denoising
voice
identification module
sound
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810153082.1A
Other languages
English (en)
Other versions
CN108172220B (zh
Inventor
陈思应
何云鹏
高君效
余杰
孙振奎
陈跃华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Leader Technology Co Ltd
Chipintelli Technology Co Ltd
Original Assignee
Chengdu Leader Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Leader Technology Co Ltd filed Critical Chengdu Leader Technology Co Ltd
Priority to CN201810153082.1A priority Critical patent/CN108172220B/zh
Publication of CN108172220A publication Critical patent/CN108172220A/zh
Application granted granted Critical
Publication of CN108172220B publication Critical patent/CN108172220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

本发明涉及语音识别领域,特别是涉及到一种新型语音除噪方法,由声音采集模块采集外部语音数据并传输给语音识别模块进行识别,语音识别模块采用了大噪声去噪模式剔除突发的大噪音,使用该方法能够将突发的大噪声剔除,保证了声源识别的准确性。

Description

一种新型语音除噪方法
技术领域
本发明涉及智能语音识别技术领域,特别是涉及到一种能够利用DNN算法来剔除突发噪音的新型语音除噪方法。
背景技术
随着人们生活水平的提高以及对电器的需求量不断增大,家用电器经过不断地改革和创新,拥有了更多使用的功能,比如微波炉,以往仅单纯的用于加热,到如今,微波炉增加了蒸煮、烧烤、热奶等功能且变得更加智能,市面出现的各种品牌的智能微波炉,主要由控制面板、观察窗、炉门安全锁系统、电源线和插头这四大部分组成,控制面板主要有功能设定、时间设定、重量设定等功能,功能设定主要是通过功能菜单实现,比如直接按清蒸鱼、蒸排骨、煮米饭等按钮,自动实现不同的加热方式,各类不同品牌的智能微波炉使用步骤都大同小异。
语音交互作为最有效的沟通控制方式,可以帮助用户把家中的各种终端设备无缝连接起来,智能语音微波炉就是其中之一,用户通过简单的语音命令即可控制微波炉进行不同的工作,在语音识别方面,为了增强用户的体验感和语音识别的准确率,研发人员通过技术互相关时延等算法获取人说话的位置,然后将此位置锁定,抑制其他位置的声源,提高信噪比,为高语音识别率做保障,声源锁定虽然可提高信噪比,但当环境中突然出现大噪声时,会将声源焦点转移,导致大噪声后语音指令无法被电子设备识别到,这就降低了用户的智能体验感和语音识别的准确率。
发明内容
为了解决上述突然出现的大噪声的语音识别问题,发明了一种能够有效剔除突发大噪声的新型语音除噪方法。
一种新型语音除噪方法,其包括以下步骤:
步骤一 语音采集模块采集外部语音数据并发送给语音识别模块;
步骤二 所述语音识别模块检测设备状态,判断所述设备是处于工作状态还是非工作状态;
步骤三 当检测到所述设备为非工作状态时,所述语音识别模块置于大噪音去噪模式对所述语音数据去噪,当检测到所述设备为工作状态时,所述语音识别模块置于常规去噪模式对所述语音数据去噪;
步骤四 将去噪后的所述语音数据经傅立叶变换输入语音识别引擎;
步骤五 所述语音识别引擎采用DNN(深度神经网络)算法在本地终端对所述语音数据进行识别;
步骤六 语音识别模块将步骤四的识别结果发送给设备控制电路;
步骤七 所述设备控制电路根据所述识别结果控制所述设备执行操作。
作为本发明的优选方案,所述语音识别模块由语音处理电路和声源锁定电路组成,所述语音处理电路处理所述语音采集模块采集到的所述语音数据,所述声源锁定电路根据所述语音分析电路的处理结果锁定声源的位置。
作为本发明的优选方案,所述语音识别模块包含有两种去噪模式,分别为所述大噪音去噪模式和常规去噪模式,所述大噪音去噪模式和常规去噪模式不能同时运行,是非此则彼的关系。
所述DNN算法包括有语音预处理、特征提取、形成发音字典及建立语音模型等四个过程,其中语音预处理过程包括对语音信号或语音数据的采样、反混叠滤波、语音增强和端点检测,特征提取过程的作用是从语音信号或语音数据的波形中提取一组能够描述语音信号或语音数据特征的参数,以便训练和识别,形成发音字典则是根据发音的音素,得到相应的文本集合即为发音字典,建立语音模型则是利用语法知识调整声学模型所识别出的不合逻辑的词语。
作为本发明的优选方案,所述语音采集模块包含有N个语音采集设备,所述N为大于等于2的正整数,N个所述语音采集设备根据客户需求进行排列,可以进行横排也可以进行竖排。
为了使音频数据容易被神经网络处理,需要把复杂的声波分解成一个个组成部分,为实现声波分解,需要利用到傅里叶变换,傅立叶变换将复杂的声波分解为简单的声波,然后将每一份频段所包含的能量加在一起,得到的结果便是从低音到高音的一个频谱,再将该频谱输入深度神经网络,对于每个小的音频切片,神经网络都将尝试找出当前正在说的声音所对应的声母或韵母,当通过神经网络跑完我们的整个音频剪辑之后,最终得到一份映射,其中标明了每个音频块和其最有可能对应的声母或韵母,然后将这些基于发音的预测与基于标注的文本数据库的可能性得分相结合,去掉最不可能的结果,留下最实际的结果。
与现有技术相比,本发明的有益效果:
1、由于采用了大噪声去噪电路,该去噪电路可以将突发的大噪声剔除,保证了声源识别的准确性。
附图说明
图1为本发明语音除噪方法的流程图;
图2为本发明语音识别模块的框图;
图3为本发明DNN算法框图。
具体实施方式
下面结合实施例及具体实施方式对本发明作进一步的详细描述,但不应将此理解为本发明上述主体的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
如图1所示,一种新型语音除噪方法,包含如下步骤:
步骤一 语音采集模块采集外部语音数据并发送给语音识别模块,本实施例中语音采集模块的语音采集设备使用麦克风,使用两个并排排列的麦克风进行语音数据的收集;
步骤二 语音识别模块检测设备状态,判断设备是处于工作状态还是非工作状态,本实施例中的设备是微波炉;
步骤三 当检测到微波炉为非工作状态时,语音识别模块置于大噪音去噪模式对语音数据去噪,当检测到微波炉为工作状态时,语音识别模块置于常规去噪模式对语音数据去噪;
步骤四 将去噪后的语音数据经傅立叶变换输入语音识别引擎;
步骤五 语音识别引擎采用DNN(深度神经网络)算法在本地终端对语音数据进行识别;
步骤六 语音识别模块将步骤四的识别结果发送给设备控制电路;
步骤七 设备控制电路根据识别结果控制微波炉执行各项操作。
如图2所示,语音识别模块由语音处理电路和电源锁定电路组成,语音处理电路处理由麦克风传输来的所采集的语音数据,并将处理结果传输给电源锁定电路,电源锁定电路根据处理结果锁定声源的位置并同时屏蔽掉声源之外的噪声。
如图3所示,DNN算法包括语音预处理、特征提取、形成发音字典及建立语音模型等四个过程,其中语音预处理过程包括对语音信号或语音数据的采样、反混叠滤波、语音增强和端点检测,特征提取过程的作用是从语音信号或语音数据的波形中提取一组能够描述语音信号或语音数据特征的参数,以便训练和识别,形成发音字典则是根据发音的音素,得到相应的文本集合即为发音字典,建立语音模型则是利用语法知识调整声学模型所识别出的不合逻辑的词语。

Claims (4)

1.一种新型语音除噪方法,其包括以下步骤:
步骤一 语音采集模块采集外部语音数据并发送给语音识别模块;
步骤二 所述语音识别模块检测设备状态,判断所述设备是处于工作状态还是非工作状态;
步骤三 当检测到所述设备为非工作状态时,所述语音识别模块置于大噪音去噪模式对所述语音数据去噪,当检测到所述设备为工作状态时,所述语音识别模块置于常规去噪模式对所述语音数据去噪;
步骤四 将去噪后的所述语音数据经傅立叶变换后输入语音识别引擎;
步骤五 所述语音识别引擎采用DNN(深度神经网络)算法在本地终端对所述语音数据进行识别;
步骤六 语音识别模块将步骤四的识别结果发送给设备控制电路;
步骤七 所述设备控制电路根据所述识别结果控制所述设备执行操作。
2.根据权利要求1所述的一种新型语音除噪方法,其特征在于:所述语音识别模块由语音处理电路和声源锁定电路组成,所述语音处理电路处理所述语音采集模块采集到的所述语音数据,所述声源锁定电路根据所述语音分析电路的处理结果锁定声源的位置。
3.根据权利要求2所述的一种新型语音除噪方法,其特征在于:所述语音识别模块包含有两种去噪模式,分别为所述大噪音去噪模式和常规去噪模式。
4.根据权利要求1所述的一种新型语音除噪方法,其特征在于:所述语音采集模块包含有N个语音采集设备,所述N为大于等于2的正整数。
CN201810153082.1A 2018-02-22 2018-02-22 一种新型语音除噪方法 Active CN108172220B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810153082.1A CN108172220B (zh) 2018-02-22 2018-02-22 一种新型语音除噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810153082.1A CN108172220B (zh) 2018-02-22 2018-02-22 一种新型语音除噪方法

Publications (2)

Publication Number Publication Date
CN108172220A true CN108172220A (zh) 2018-06-15
CN108172220B CN108172220B (zh) 2022-02-25

Family

ID=62510565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810153082.1A Active CN108172220B (zh) 2018-02-22 2018-02-22 一种新型语音除噪方法

Country Status (1)

Country Link
CN (1) CN108172220B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109346066A (zh) * 2018-09-26 2019-02-15 珠海格力电器股份有限公司 一种语音降噪的方法及装置
CN109378013A (zh) * 2018-11-19 2019-02-22 南瑞集团有限公司 一种语音降噪方法
CN109817199A (zh) * 2019-01-03 2019-05-28 珠海市黑鲸软件有限公司 一种风扇语音控制系统的语音识别方法
CN110738983A (zh) * 2018-07-02 2020-01-31 成都启英泰伦科技有限公司 基于设备工作状态切换的多神经网络模型语音识别方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030139851A1 (en) * 2000-06-09 2003-07-24 Kazuhiro Nakadai Robot acoustic device and robot acoustic system
JP2007065122A (ja) * 2005-08-30 2007-03-15 Aisin Seiki Co Ltd 車載用音声認識装置の雑音抑圧装置
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
US20150019215A1 (en) * 2013-07-11 2015-01-15 Samsung Electronics Co., Ltd. Electric equipment and control method thereof
CN104424953A (zh) * 2013-09-11 2015-03-18 华为技术有限公司 语音信号处理方法与装置
US20150100310A1 (en) * 2013-10-08 2015-04-09 Samsung Electronics Co., Ltd. Apparatus and method of reducing noise and audio playing apparatus with non-magnet speaker
CN104575513A (zh) * 2013-10-24 2015-04-29 展讯通信(上海)有限公司 突发噪声的处理系统、突发噪声的检测及抑制方法与装置
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN105187604A (zh) * 2015-09-30 2015-12-23 联想(北京)有限公司 一种信息处理方法和电子设备
US20160019904A1 (en) * 2014-07-17 2016-01-21 Ford Global Technologies, Llc Adaptive Vehicle State-Based Hands-Free Phone Noise Reduction With Learning Capability
CN105976826A (zh) * 2016-04-28 2016-09-28 中国科学技术大学 应用于双麦克风小型手持设备的语音降噪方法
CN205943457U (zh) * 2016-07-11 2017-02-08 九阳股份有限公司 一种声控扫地机
CN106448696A (zh) * 2016-12-20 2017-02-22 成都启英泰伦科技有限公司 一种基于背景噪声估计自适应高通滤波语音降噪方法
CN107610698A (zh) * 2017-08-28 2018-01-19 深圳市金立通信设备有限公司 一种实现语音控制的方法、机器人及计算机可读存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030139851A1 (en) * 2000-06-09 2003-07-24 Kazuhiro Nakadai Robot acoustic device and robot acoustic system
JP2007065122A (ja) * 2005-08-30 2007-03-15 Aisin Seiki Co Ltd 車載用音声認識装置の雑音抑圧装置
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
US20150019215A1 (en) * 2013-07-11 2015-01-15 Samsung Electronics Co., Ltd. Electric equipment and control method thereof
CN104424953A (zh) * 2013-09-11 2015-03-18 华为技术有限公司 语音信号处理方法与装置
US20150100310A1 (en) * 2013-10-08 2015-04-09 Samsung Electronics Co., Ltd. Apparatus and method of reducing noise and audio playing apparatus with non-magnet speaker
CN104575513A (zh) * 2013-10-24 2015-04-29 展讯通信(上海)有限公司 突发噪声的处理系统、突发噪声的检测及抑制方法与装置
US20160019904A1 (en) * 2014-07-17 2016-01-21 Ford Global Technologies, Llc Adaptive Vehicle State-Based Hands-Free Phone Noise Reduction With Learning Capability
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN105187604A (zh) * 2015-09-30 2015-12-23 联想(北京)有限公司 一种信息处理方法和电子设备
CN105976826A (zh) * 2016-04-28 2016-09-28 中国科学技术大学 应用于双麦克风小型手持设备的语音降噪方法
CN205943457U (zh) * 2016-07-11 2017-02-08 九阳股份有限公司 一种声控扫地机
CN106448696A (zh) * 2016-12-20 2017-02-22 成都启英泰伦科技有限公司 一种基于背景噪声估计自适应高通滤波语音降噪方法
CN107610698A (zh) * 2017-08-28 2018-01-19 深圳市金立通信设备有限公司 一种实现语音控制的方法、机器人及计算机可读存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
RAVI VAIDYANATHAN: "A wavelet denoising approach for signal action isolation in the ear canal", 《2008 30TH ANNUAL INTERNATIONAL CONFERENCE OF THE IEEE ENGINEERING IN MEDICINE AND BIOLOGY SOCIETY》 *
徐勇: "基于深层神经网络的语音增强方法研究", 《中国优秀博士学位论文全文数据库信息科技辑》 *
解传栋: "资源稀少情况下的语音识别的主动学习方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
韦康博: "《人工智能 比你想象的更具颠覆性的智能革命》", 30 September 2016 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738983A (zh) * 2018-07-02 2020-01-31 成都启英泰伦科技有限公司 基于设备工作状态切换的多神经网络模型语音识别方法
CN109346066A (zh) * 2018-09-26 2019-02-15 珠海格力电器股份有限公司 一种语音降噪的方法及装置
CN109346066B (zh) * 2018-09-26 2021-04-16 珠海格力电器股份有限公司 一种语音降噪的方法及装置
CN109378013A (zh) * 2018-11-19 2019-02-22 南瑞集团有限公司 一种语音降噪方法
CN109378013B (zh) * 2018-11-19 2023-02-03 南瑞集团有限公司 一种语音降噪方法
CN109817199A (zh) * 2019-01-03 2019-05-28 珠海市黑鲸软件有限公司 一种风扇语音控制系统的语音识别方法

Also Published As

Publication number Publication date
CN108172220B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
CN108172220A (zh) 一种新型语音除噪方法
CN110120227A (zh) 一种深度堆叠残差网络的语音分离方法
CN106847281A (zh) 基于语音模糊识别技术的智能家居语音控制系统及方法
CN102005070A (zh) 一种语音识别门禁系统
US20170154640A1 (en) Method and electronic device for voice recognition based on dynamic voice model selection
CN109256139A (zh) 一种基于Triplet-Loss的说话人识别方法
CN108847238A (zh) 一种新型服务机器人语音识别方法
CN106448654A (zh) 一种机器人语音识别系统及其工作方法
CN108922541A (zh) 基于dtw和gmm模型的多维特征参数声纹识别方法
CN106971714A (zh) 一种应用于机器人的语音去噪识别方法及装置
CN110189746A (zh) 一种应用于地空通信的话音识别方法
CN104952446A (zh) 基于语音交互的数字楼盘展示系统
CN108091327A (zh) 一种智能语音设备控制方法
CN104361787A (zh) 信号转换系统和信号转换方法
CN109215634A (zh) 一种多词语音控制通断装置的方法及其系统
CN106448657A (zh) 一种用于餐厅机器人服务员的连续语音识别系统
CN111105798B (zh) 基于语音识别的设备控制方法
CN105405447B (zh) 一种送话呼吸噪声屏蔽方法
CN109544745A (zh) 一种智能门锁控制方法、装置及系统
Wang et al. Application of speech recognition technology in IoT smart home
CN107393533B (zh) 一种通过语音控制跑步机的装置
CN106897693B (zh) 一种身份识别方法、装置及系统
CN106971712A (zh) 一种自适应的快速声纹识别方法及系统
CN108198567A (zh) 一种新型语音除噪系统
CN113077798B (zh) 一种居家老人呼救设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant