CN110265014A - 一种语音控制的方法、装置及翻译机 - Google Patents

一种语音控制的方法、装置及翻译机 Download PDF

Info

Publication number
CN110265014A
CN110265014A CN201910550989.6A CN201910550989A CN110265014A CN 110265014 A CN110265014 A CN 110265014A CN 201910550989 A CN201910550989 A CN 201910550989A CN 110265014 A CN110265014 A CN 110265014A
Authority
CN
China
Prior art keywords
noise reduction
module
processor
noise
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910550989.6A
Other languages
English (en)
Inventor
付金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201910550989.6A priority Critical patent/CN110265014A/zh
Publication of CN110265014A publication Critical patent/CN110265014A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种语音控制的方法、装置及翻译机,通过语音输入模块采集用户的语音命令,并发送至语音识别模块识别为文字信息,处理器提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列,由执行单元按照顺序依次执行,由此可实现复杂语音指令的准确识别,将此方法应用于如翻译机等电子设备上时,可提高其人机交互的智能化水平,对于用户提出的复杂语音指令也可以准确完成,同时,还具有降噪功能,即使在嘈杂的使用环境下,也可以精确的识别出用户的语音指令,相比较传统的翻译机具有较高的用户体验度。

Description

一种语音控制的方法、装置及翻译机
技术领域
本发明涉及电数字数据处理技术领域,尤其涉及一种语音控制的方法、装置及翻译机。
背景技术
目前,要控制如翻译机、电视、平板电脑等电子设备时,一般通过电子设备的控制面板输入要求执行的动作,或者通过语音控制实现人机交互,进而命令电子设备完成所要执行的动作。但是,现有技术中的语音控制功能只能够实现一些简单的语音指令,对于用户提出的复杂操作指令,现有技术中的语音控制方法尚不能智能化识别。
发明内容
为解决现有技术中,对于用户提出的复杂操作指令,现有技术中的语音控制方法尚不能智能化识别的技术问题,本发明的技术方案如下:
本发明中的一种语音控制的方法,包括如下步骤:
步骤S01,语音输入模块采集用户的语音命令,并将采集到的语音命令发送至语音识别模块;
步骤S02,语音识别模块将用户的语音命令识别并转换为文字信息,并将文字信息发送至处理器;
步骤S03,处理器提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列;
步骤S04,处理器将排列后的命令信息发送至执行单元,执行单元按照命令信息执行命令。
进一步,步骤S01之前还包括如下步骤:
步骤S00,降噪发生模块对外界噪音进行降噪。
进一步,步骤S00之中包括如下步骤:
步骤S001,语音输入模块采集外界的噪音信息,并将采集到的噪音信息发送至处理器;
步骤S002,处理器查找反映噪音信息与降噪等级之间对应关系的对照表,确定对应的当前噪音信息的降噪等级,处理器根据噪音信息的强度确定外界环境的噪音等级;
步骤S003,处理器根据噪音等级设置与当前噪音等级对应的降噪增益值,并将降噪增益值发送至降噪处理模块;
步骤S004,降噪处理模块按照降噪增益值对外界噪音进行降噪处理得到降噪信号,并将降噪信号发送至降噪发生模块;
步骤S005,降噪发生模块播放降噪信号。
进一步,步骤S003中包括如下步骤:
处理器查找反映降噪等级与降噪增益值之间对应关系的对照表,确定对应的当前噪音等级的降噪增益值,处理器设置与当前噪音等级对应的降噪增益值。
进一步,步骤S002之中还包括如下步骤:
处理器根据噪音等级判断是否进行降噪处理,如是,则进行步骤S003,如否,则进行步骤S01。
本发明还提供了一种语音控制的装置,包括语音输入模块、语音识别模块、处理器及执行单元,所述语音输入模块与语音识别模块电性连接,所述语音识别模块及执行单元分别与处理器电性连接。
进一步,所述语音输入模块用于采集用户的语音命令;
所述语音识别模块用于将用户的语音命令识别并转换为文字信息;
所述处理器用于提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列;
所述执行单元用于执行命令信息。
进一步,一种语音控制的装置还包括降噪处理模块及降噪发生模块,所述降噪处理模块与降噪发生模块电性连接,所述降噪处理模块与处理器电性连接。
进一步,所述语音输入模块还用于采集外界的噪音信息;
所述处理器还用于查找反映噪音信息与降噪等级之间对应关系的对照表,确定对应的当前噪音信息的降噪等级,并由噪音等级确定与当前噪音等级对应的降噪增益值;
所述降噪处理模块用于按照降噪增益值对外界噪音进行降噪处理得到降噪信号;
所述降噪发生模块用于播放降噪信号。
本发明还提供了一种语音控制的翻译机,所述翻译机包括上述语音控制的装置。
本发明中的一种语音控制的方法、装置及翻译机,与现有技术相比,其有益效果为:
本发明中的一种语音控制的方法、装置及翻译机,通过语音输入模块采集用户的语音命令,并发送至语音识别模块识别为文字信息,处理器提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列,由执行单元按照顺序依次执行,由此可实现复杂语音指令的准确识别,将此方法应用于如翻译机等电子设备上时,可提高其人机交互的智能化水平,对于用户提出的复杂语音指令也可以准确完成,同时,还具有降噪功能,即使在嘈杂的使用环境下,也可以精确的识别出用户的语音指令,相比较传统的翻译机具有较高的用户体验度。
附图说明
图1是本发明中一种语音控制的装置的示意图。
具体实施方式
下面将结合本发明的附图,对本发明的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中的一种语音控制的方法,包括如下步骤:
步骤S01,语音输入模块采集用户的语音命令,并将采集到的语音命令发送至语音识别模块。
步骤S02,语音识别模块将用户的语音命令识别并转换为文字信息,并将文字信息发送至处理器。
步骤S03,处理器提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列。其中,两个关键词的简单语音命令可以不用进行逻辑排序,比如,打开视频、关闭屏幕等,可将命令信息直接发送至执行单元;多个关键词的复杂语音命令需要进行逻辑顺序排列,比如,关闭音乐播放器,打开翻译功能,并调大播放音量,这组语音命令包含多个关键词,逻辑顺序排列为:关闭、音乐播放器→打开、翻译功能→调大、播放音量,如果不进行逻辑顺序排列,可能会出现调大音乐播放器的播放音量,后执行打开翻译功能。
步骤S04,处理器将排列后的命令信息发送至执行单元,执行单元按照命令信息执行命令。
为避免外界噪音对语音输入模块造成干扰,导致后续语音识别模块识别的语音命令不准确,在语音输入模块采集用户语音命令之前,即步骤S01之前还包括如下步骤:
步骤S00,降噪发生模块对外界噪音进行降噪。该步骤对外界噪音进行主动降噪,提高后续步骤的命令识别准确率。
具体地,步骤S00之中包括如下步骤:
步骤S001,语音输入模块采集外界的噪音信息,并将采集到的噪音信息发送至处理器。
步骤S002,处理器查找反映噪音信息与降噪等级之间对应关系的对照表,确定对应的当前噪音信息的降噪等级,处理器根据噪音信息的强度确定外界环境的噪音等级。
步骤S003,处理器根据噪音等级设置与当前噪音等级对应的降噪增益值,并将降噪增益值发送至降噪处理模块。
步骤S004,降噪处理模块按照降噪增益值对外界噪音进行降噪处理得到降噪信号,并将降噪信号发送至降噪发生模块。
步骤S005,降噪发生模块播放降噪信号。降噪发生模块发射与噪音相位相反、振幅相同的声波来抵挡噪音,使得噪音消失。
进一步,步骤S003中包括如下步骤:
处理器查找反映降噪等级与降噪增益值之间对应关系的对照表,如表1所示,确定对应的当前噪音等级的降噪增益值,处理器设置与当前噪音等级对应的降噪增益值。
表1噪音分贝值、噪音等级及降噪增益值对照表
噪音分贝值 噪音等级 降噪增益值
0-20分贝 0级 0
21-30分贝 1级 0.2
31-40分贝 2级 0.3
41-50分贝 3级 0.4
51-55分贝 4级 0.5
55-60分贝 5级 0.6
61-65分贝 6级 0.7
65分贝 7级 0.8
进一步,步骤S002之中还包括如下步骤:
处理器根据噪音等级判断是否进行降噪处理,如是,则进行步骤S003,如否,则进行步骤S01,例如,噪音等级为0级时,周围环境安静且语音识别模块可准确识别语音命令,固不需要降噪。
如图1所示,本发明还提供了一种语音控制的装置,包括语音输入模块1、语音识别模块2、处理器4及执行单元3,所述语音输入模块1与语音识别模块2电性连接,所述语音识别模块2及执行单元3分别与处理器4电性连接。
进一步,所述语音输入模块用于采集用户的语音命令;
所述语音识别模块用于将用户的语音命令识别并转换为文字信息;
所述处理器用于提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列;
所述执行单元用于执行命令信息。
进一步,一种语音控制的装置还包括降噪处理模块5及降噪发生模块6,所述降噪处理模块5与降噪发生模块6电性连接,所述降噪处理模块5与处理器4电性连接。
进一步,所述语音输入模块还用于采集外界的噪音信息;
所述处理器还用于查找反映噪音信息与降噪等级之间对应关系的对照表,确定对应的当前噪音信息的降噪等级,并由噪音等级确定与当前噪音等级对应的降噪增益值;
所述降噪处理模块用于按照降噪增益值对外界噪音进行降噪处理得到降噪信号;
所述降噪发生模块用于播放降噪信号。
本发明还提供了一种语音控制的翻译机,所述翻译机包括上述语音控制的装置。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种语音控制的方法,其特征在于,包括如下步骤:
步骤S01,语音输入模块采集用户的语音命令,并将采集到的语音命令发送至语音识别模块;
步骤S02,语音识别模块将用户的语音命令识别并转换为文字信息,并将文字信息发送至处理器;
步骤S03,处理器提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列;
步骤S04,处理器将排列后的命令信息发送至执行单元,执行单元按照命令信息执行命令。
2.根据权利要求1所述的一种语音控制的方法,其特征在于,步骤S01之前还包括如下步骤:
步骤S00,降噪发生模块对外界噪音进行降噪。
3.根据权利要求2所述的一种语音控制的方法,其特征在于,步骤S00之中包括如下步骤:
步骤S001,语音输入模块采集外界的噪音信息,并将采集到的噪音信息发送至处理器;
步骤S002,处理器查找反映噪音信息与降噪等级之间对应关系的对照表,确定对应的当前噪音信息的降噪等级,处理器根据噪音信息的强度确定外界环境的噪音等级;
步骤S003,处理器根据噪音等级设置与当前噪音等级对应的降噪增益值,并将降噪增益值发送至降噪处理模块;
步骤S004,降噪处理模块按照降噪增益值对外界噪音进行降噪处理得到降噪信号,并将降噪信号发送至降噪发生模块;
步骤S005,降噪发生模块播放降噪信号。
4.根据权利要求3所述的一种语音控制的方法,其特征在于,步骤S003中包括如下步骤:
处理器查找反映降噪等级与降噪增益值之间对应关系的对照表,确定对应的当前噪音等级的降噪增益值,处理器设置与当前噪音等级对应的降噪增益值。
5.根据权利要求3所述的一种语音控制的方法,其特征在于,步骤S002之中还包括如下步骤:
处理器根据噪音等级判断是否进行降噪处理,如是,则进行步骤S003,如否,则进行步骤S01。
6.一种语音控制的装置,其特征在于,包括语音输入模块、语音识别模块、处理器及执行单元,所述语音输入模块与语音识别模块电性连接,所述语音识别模块及执行单元分别与处理器电性连接。
7.根据权利要求6所述的一种语音控制的装置,其特征在于,所述语音输入模块用于采集用户的语音命令;
所述语音识别模块用于将用户的语音命令识别并转换为文字信息;
所述处理器用于提取文字信息中的关键词并分析出相对应的命令信息,并将命令信息按照先后逻辑顺序排列;
所述执行单元用于执行命令信息。
8.根据权利要求7所述的一种语音控制的装置,其特征在于,还包括降噪处理模块及降噪发生模块,所述降噪处理模块与降噪发生模块电性连接,所述降噪处理模块与处理器电性连接。
9.根据权利要求8所述的一种语音控制的装置,其特征在于,所述语音输入模块还用于采集外界的噪音信息;
所述处理器还用于查找反映噪音信息与降噪等级之间对应关系的对照表,确定对应的当前噪音信息的降噪等级,并由噪音等级确定与当前噪音等级对应的降噪增益值;
所述降噪处理模块用于按照降噪增益值对外界噪音进行降噪处理得到降噪信号;
所述降噪发生模块用于播放降噪信号。
10.一种语音控制的翻译机,其特征在于,所述翻译机包括如权利要求6-9中任一项所述语音控制的装置。
CN201910550989.6A 2019-06-24 2019-06-24 一种语音控制的方法、装置及翻译机 Pending CN110265014A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910550989.6A CN110265014A (zh) 2019-06-24 2019-06-24 一种语音控制的方法、装置及翻译机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910550989.6A CN110265014A (zh) 2019-06-24 2019-06-24 一种语音控制的方法、装置及翻译机

Publications (1)

Publication Number Publication Date
CN110265014A true CN110265014A (zh) 2019-09-20

Family

ID=67921043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910550989.6A Pending CN110265014A (zh) 2019-06-24 2019-06-24 一种语音控制的方法、装置及翻译机

Country Status (1)

Country Link
CN (1) CN110265014A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053702A (zh) * 2020-09-30 2020-12-08 北京大米科技有限公司 一种语音处理的方法、装置及电子设备
CN112614486A (zh) * 2020-10-30 2021-04-06 小狗电器互联网科技(北京)股份有限公司 应用于扫地机的语音控制执行功能方法、装置、电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979415A (zh) * 2016-05-30 2016-09-28 歌尔股份有限公司 一种自适应调节降噪增益的降噪方法、装置及降噪耳机
CN107342075A (zh) * 2016-07-22 2017-11-10 江苏泰格软件有限公司 一种语音控制执行aps系统指令的系统与方法
CN108648756A (zh) * 2018-05-21 2018-10-12 百度在线网络技术(北京)有限公司 语音交互方法、装置和系统
CN109637538A (zh) * 2018-12-29 2019-04-16 深圳市力合微电子股份有限公司 一种实现语音控制的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979415A (zh) * 2016-05-30 2016-09-28 歌尔股份有限公司 一种自适应调节降噪增益的降噪方法、装置及降噪耳机
CN107342075A (zh) * 2016-07-22 2017-11-10 江苏泰格软件有限公司 一种语音控制执行aps系统指令的系统与方法
CN108648756A (zh) * 2018-05-21 2018-10-12 百度在线网络技术(北京)有限公司 语音交互方法、装置和系统
CN109637538A (zh) * 2018-12-29 2019-04-16 深圳市力合微电子股份有限公司 一种实现语音控制的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053702A (zh) * 2020-09-30 2020-12-08 北京大米科技有限公司 一种语音处理的方法、装置及电子设备
CN112053702B (zh) * 2020-09-30 2024-03-19 北京大米科技有限公司 一种语音处理的方法、装置及电子设备
CN112614486A (zh) * 2020-10-30 2021-04-06 小狗电器互联网科技(北京)股份有限公司 应用于扫地机的语音控制执行功能方法、装置、电子设备

Similar Documents

Publication Publication Date Title
CN110310623B (zh) 样本生成方法、模型训练方法、装置、介质及电子设备
WO2019101123A1 (zh) 语音活性检测方法、相关装置和设备
CN110853617B (zh) 一种模型训练的方法、语种识别的方法、装置及设备
CN102298443B (zh) 结合视频通道的智能家居语音控制系统及其控制方法
CN110853618A (zh) 一种语种识别的方法、模型训练的方法、装置及设备
US11587563B2 (en) Determining input for speech processing engine
CN107369439B (zh) 一种语音唤醒方法和装置
CN101923857A (zh) 一种人机交互的可扩展语音识别方法
CN102385860A (zh) 信息处理设备、信息处理方法及程序
CN102723078A (zh) 基于自然言语理解的语音情感识别方法
CN105096935A (zh) 一种语音输入方法、装置和系统
CN104575504A (zh) 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN106971723A (zh) 语音处理方法和装置、用于语音处理的装置
CN110544473B (zh) 语音交互方法和装置
CN108461081B (zh) 语音控制的方法、装置、设备和存储介质
CN111028845A (zh) 多音频识别方法、装置、设备及可读存储介质
CN106558306A (zh) 用于语音识别的方法、装置和设备
CN110706707B (zh) 用于语音交互的方法、装置、设备和计算机可读存储介质
CN110265014A (zh) 一种语音控制的方法、装置及翻译机
CN103198829A (zh) 一种降低车内噪音提高语音识别率的方法、装置和设备
CN110211609A (zh) 一种提升语音识别准确率的方法
CN106228047A (zh) 一种应用程序图标处理方法及终端设备
CN111105798B (zh) 基于语音识别的设备控制方法
CN110728993A (zh) 一种变声识别方法及电子设备
WO2022134025A1 (zh) 一种离线语音识别方法和装置、电子设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190920

RJ01 Rejection of invention patent application after publication