CN102103858B - 一种基于语音的控制方法及系统 - Google Patents

一种基于语音的控制方法及系统 Download PDF

Info

Publication number
CN102103858B
CN102103858B CN2010106097290A CN201010609729A CN102103858B CN 102103858 B CN102103858 B CN 102103858B CN 2010106097290 A CN2010106097290 A CN 2010106097290A CN 201010609729 A CN201010609729 A CN 201010609729A CN 102103858 B CN102103858 B CN 102103858B
Authority
CN
China
Prior art keywords
voice command
voice
tone
wave table
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010106097290A
Other languages
English (en)
Other versions
CN102103858A (zh
Inventor
龚健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder International Co Ltd
Original Assignee
Founder International Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder International Co Ltd filed Critical Founder International Co Ltd
Priority to CN2010106097290A priority Critical patent/CN102103858B/zh
Publication of CN102103858A publication Critical patent/CN102103858A/zh
Application granted granted Critical
Publication of CN102103858B publication Critical patent/CN102103858B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Lock And Its Accessories (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种控制方法及系统,尤其是涉及一种基于语音的控制方法及系统。本发明预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系;操作人员发出语音命令;将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配;如果存在相匹配的语音命令,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,语音命令无效。本发明无需手动输入操作指令,通过语音便可控制设备的启动或运行,操作方便。

Description

一种基于语音的控制方法及系统
技术领域
本发明涉及一种控制方法及系统,尤其是涉及一种基于语音的控制方法及系统。
背景技术
在利用操作指令控制设备运行的应用场合,常常是通过输入操作指令的方式来启动设备的运行。一旦非法人员获取了操作指令,便可以合法身份来操作设备,安全性较差。例如,密码门禁系统,当操作人员输入正确的密码后,门便会开启,即只认密码不认人。显然,这种门禁系统的安全性无法得到保障。
如果采用语音来控制设备的运行,不但无需输入操作指令,而且兼具身份识别的能力,无疑能够提高系统的安全性。现有的语音识别系统能够识别出语音的语义内容,但识别过程较为复杂,识别效率也相对较低,不适合在此应该场合下使用。而且,操作指令大都相对简单,没有必要采用现有的较为复杂的语音识别系统。
发明内容
针对现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种操作方便、安全性好的基于语音的控制方法及系统。
为解决上述技术问题,本发明采用的技术方案如下:
一种基于语音的控制方法,包括以下步骤:
(1)预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系;
(2)操作人员发出语音命令;
(3)将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配;如果存在相匹配的语音命令,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,语音命令无效。
如上所述的基于语音的控制方法,其中,波形特征包括音调和波表。
如上所述的基于语音的控制方法,步骤(3)中所述将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配的方法如下:
(a)采集操作人员发出的语音命令;
(b)提取所述语音命令的音调;
(c)与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(d)提取语音命令的波表;
(e)与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败。
如上所述的基于语音的控制方法,其中,在采集操作人员发出的语音命令后,提取语音命令的音调之前,还包括对采集的语音命令进行去噪处理的步骤。
如上所述的基于语音的控制方法,步骤(1)中,将所述语音命令分成若干节,存储每一节语音命令的波形特征。步骤(3)中,如果每一节语音命令的波形特征均与预存储的相对应节的语音命令的波形特征相匹配,则获取该语音命令对应的操作指令。
一种基于语音的控制系统,包括用于预存储语音命令、语音命令的波形特征以及操作指令三者之间映射关系的预存储装置;
用于匹配操作人员发出的语音命令的波形特征与预存储的语音命令的波形特征的匹配装置;匹配装置进一步包括用于采集操作人员发出的语音命令的采集单元,用于对采集的语音命令进行去噪处理的去噪单元,用于提取语音命令音调的音调提取单元,用于匹配提取的音调与预存储的音调的音调匹配单元,用于提取语音命令波表的波表提取单元,用于匹配提取的波表与预存储的波表的波表匹配单元;
用于获取相匹配的语音命令对应的操作指令的获取装置;
以及用于执行获取的操作指令的执行装置;
所述的匹配装置(12)的匹配过程如下:
(a)采集单元(121)采集操作人员发出的语音命令;
(b)去噪单元(122)对采集的语音命令进行去噪处理;
(c)音调提取单元(123)提取采集的语音命令的音调;
(d)音调匹配单元(124)与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(e)波表提取单元(125)提取语音命令的波表;
(f)波表匹配单元(126)与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败。
本发明所述方法及系统,无需手动输入操作指令,通过语音便可控制设备的启动或运行,操作方便。而且,通过语音可以判断出当前操作人员是否是合法的操作人员,避免了非法操作人员的非法操作,提高了安全性。
附图说明
图1是具体实施方式中基于语音的控制系统的结构框图;
图2是具体实施方式中基于语音的控制方法的流程图;
图3是具体实施方式中语音的波形特征匹配方法的流程图。
具体实施方式
下面结合具体实施方式和附图对本发明进行详细描述。
如图1所示,本实施方式中基于语音的控制系统包括预存储装置11,与预存储装置连接的匹配装置12,与预存储装置11和匹配装置12连接的获取装置13,以及与获取装置13连接的执行装置14。其中,匹配装置12包括采集单元121、去噪单元122、音调提取单元123、音调匹配单元124、波表提取单元125和波表匹配单元126。
预存储装置11用于预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系。
匹配装置12用于匹配操作人员发出的语音命令的波形特征与预存储的语音命令的波形特征,所述波形特征包括音调和波表。其中,采集单元121用于采集操作人员发出的语音命令。去噪单元122用于对采集的语音命令进行去噪处理。音调提取单元123用于提取语音命令的音调。音调匹配单元124匹配提取的音调与预存储的音调。波表提取单元125提取语音命令的波表。波表匹配单元126用于匹配提取的波表与预存储的波表。
获取装置13用于获取相匹配的语音命令对应的操作指令。
执行装置14用于执行获取的操作指令。
如图2所示,基于图1所示系统的控制方法包括以下步骤:
(1)预存储装置11预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系。
所述语音命令的波形特征包括音调和波表,可以将语音命令、语音命令的音调和波表及相对应的操作指令预存储在如下表头结构的映射表中。
  语音命令   语音命令音调   语音命令波表   操作指令
(2)操作人员发出语音命令。
(3)匹配装置12将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配;如果存在相匹配的语音命令,则获取装置13根据所述映射关系获取相匹配的语音命令对应的操作指令后由执行装置14执行该操作指令;否则,语音命令无效。
如图3所示,具体的匹配方法如下:
(a)采集单元121采集操作人员发出的语音命令;
(b)去噪单元122对采集的语音命令进行去噪处理;
(c)音调提取单元123提取采集的语音命令的音调;
(d)音调匹配单元124与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(e)波表提取单元125提取语音命令的波表;
(f)波表匹配单元126与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败。
优选的,将语音命令分成若干节,存储每一节语音命令的波形特征,其映射表的表头结构如下所示:
Figure GSB00000845446300051
操作人员发出所有节语音命令,每节语音命令间隔适当的时间。匹配装置12采集每一节语音命令,依次匹配每一节语音命令的音调和波表特征,如果每一节语音命令的波形特征均与预存储的相对应节的语音命令的波形特征相匹配,则获取该语音命令对应的操作指令。如果有一节语音命令的音调或波表不匹配,则匹配失败。
这种方式,由于操作人员并非一次性连续发出整个语音命令,因此,可降低整个语音命令被录音,利用录音进行操作控制的可能性,提高了系统的安全性。
波形特征的具体匹配方法为现有技术,可以通过采集声音的波形,之后对其进行快速傅立叶变换(Fast Fourier Transform)得到声音波形的频谱,匹配频谱。也可以继续按照短时FFT算法或者时域滤波法处理,再检测与预先存储的波形特征是否匹配。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (5)

1.一种基于语音的控制方法,包括以下步骤:
(1)预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系,所述波形特征包括音调和波表;
(2)操作人员发出语音命令;
(3)将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配,匹配的方法如下:
(a)采集操作人员发出的语音命令;
(b)提取所述语音命令的音调;
(c)与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(d)提取语音命令的波表;
(e)与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败;
如果存在相匹配的语音命令,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,语音命令无效。
2.如权利要求1所述的基于语音的控制方法,其特征在于:在采集操作人员发出的语音命令后,提取语音命令的音调之前,还包括对采集的语音命令进行去噪处理的步骤。
3.如权利要求1或2所述的基于语音的控制方法,其特征在于:步骤(1)中,将所述语音命令分成若干节,存储每一节语音命令的波形特征。
4.如权利要求3所述的基于语音的控制方法,其特征在于:步骤(3)中,如果每一节语音命令的波形特征均与预存储的相对应节的语音命令的波形特征相匹配,则获取该语音命令对应的操作指令。
5.一种基于语音的控制系统,其特征在于:包括用于预存储语音命令、语音命令的波形特征以及操作指令三者之间映射关系的预存储装置(11);
用于匹配操作人员发出的语音命令的波形特征与预存储的语音命令的波形特征的匹配装置(12),匹配装置(12)进一步包括用于采集操作人员发出的语音命令的采集单元(121),用于对采集的语音命令进行去噪处理的去噪单元(122),用于提取语音命令音调的音调提取单元(123),用于匹配提取的音调与预存储的音调的音调匹配单元(124),用于提取语音命令波表的波表提取单元(125),用于匹配提取的波表与预存储的波表的波表匹配单元(126);
用于获取相匹配的语音命令对应的操作指令的获取装置(13);
以及用于执行获取的操作指令的执行装置(14);
所述的匹配装置(12)的匹配过程如下:
(a)采集单元(121)采集操作人员发出的语音命令;
(b)去噪单元(122)对采集的语音命令进行去噪处理;
(c)音调提取单元(123)提取采集的语音命令的音调;
(d)音调匹配单元(124)与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(e)波表提取单元(125)提取语音命令的波表;
(f)波表匹配单元(126)与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败。
CN2010106097290A 2010-12-15 2010-12-15 一种基于语音的控制方法及系统 Expired - Fee Related CN102103858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010106097290A CN102103858B (zh) 2010-12-15 2010-12-15 一种基于语音的控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010106097290A CN102103858B (zh) 2010-12-15 2010-12-15 一种基于语音的控制方法及系统

Publications (2)

Publication Number Publication Date
CN102103858A CN102103858A (zh) 2011-06-22
CN102103858B true CN102103858B (zh) 2013-07-24

Family

ID=44156575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010106097290A Expired - Fee Related CN102103858B (zh) 2010-12-15 2010-12-15 一种基于语音的控制方法及系统

Country Status (1)

Country Link
CN (1) CN102103858B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775191B1 (en) * 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
US9564128B2 (en) * 2013-12-09 2017-02-07 Qualcomm Incorporated Controlling a speech recognition process of a computing device
CN105739940A (zh) * 2014-12-08 2016-07-06 中兴通讯股份有限公司 存储方法及装置
CN105139853A (zh) * 2015-08-13 2015-12-09 深圳市双平泰科技有限公司 一种体征检测装置的控制方法及装置
CN105976814B (zh) * 2015-12-10 2020-04-10 乐融致新电子科技(天津)有限公司 头戴设备的控制方法和装置
CN105897686A (zh) * 2015-12-21 2016-08-24 乐视致新电子科技(天津)有限公司 智能电视语音管理用户账号方法及智能电视
CN109597657B (zh) * 2017-09-29 2022-04-29 阿里巴巴(中国)有限公司 针对目标应用的操作方法、装置及计算设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1316726A (zh) * 2000-02-02 2001-10-10 摩托罗拉公司 语音识别的方法和装置
CN1400526A (zh) * 2001-07-31 2003-03-05 明碁电通股份有限公司 语音控制系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1316726A (zh) * 2000-02-02 2001-10-10 摩托罗拉公司 语音识别的方法和装置
CN1400526A (zh) * 2001-07-31 2003-03-05 明碁电通股份有限公司 语音控制系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵力.语音识别.《语音信号处理》.2003,217,221. *

Also Published As

Publication number Publication date
CN102103858A (zh) 2011-06-22

Similar Documents

Publication Publication Date Title
CN102103858B (zh) 一种基于语音的控制方法及系统
WO2019137066A1 (zh) 电器控制方法及装置
CN104123939A (zh) 基于变电站巡检机器人的语音交互控制方法
JP2012527850A5 (zh)
CN104517607A (zh) 滤除语音控制电器中的噪声的方法及语音控制电器
CN106448684A (zh) 基于深度置信网络特征矢量的信道鲁棒声纹识别系统
CN105575391A (zh) 声纹信息管理方法、装置以及身份认证方法、系统
CN102005070A (zh) 一种语音识别门禁系统
CN105357006A (zh) 一种基于声纹特征进行安全认证的方法及设备
CN106847281A (zh) 基于语音模糊识别技术的智能家居语音控制系统及方法
CN106127896A (zh) 一种智能门锁控制系统及方法
CN104538034A (zh) 一种语音识别方法及系统
CN102930869A (zh) 利用声学指纹鉴别发令人身份的语音操作控制装置及方法
CN104142831B (zh) 应用程序搜索方法及装置
CN103106061A (zh) 语音输入方法和装置
CN104517066A (zh) 一种文件夹加密方法
WO2014173325A1 (zh) 喉音识别方法及装置
CN110488675A (zh) 一种基于动态规整算法的变电站声信号特征提取方法
CN108172220A (zh) 一种新型语音除噪方法
CN110111794A (zh) 应用程序的启动方法、装置、计算机设备及存储介质
CN108091327A (zh) 一种智能语音设备控制方法
CN106340299A (zh) 一种复杂环境下的说话人识别系统及方法
CN102831890A (zh) 一种对文本无关的声纹进行识别的方法
CN104123486A (zh) 具有声纹识别的非接触式电脑安全登录的系统和方法
CN111105798B (zh) 基于语音识别的设备控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130724

Termination date: 20141215

EXPY Termination of patent right or utility model