CN102103858A - 一种基于语音的控制方法及系统 - Google Patents
一种基于语音的控制方法及系统 Download PDFInfo
- Publication number
- CN102103858A CN102103858A CN2010106097290A CN201010609729A CN102103858A CN 102103858 A CN102103858 A CN 102103858A CN 2010106097290 A CN2010106097290 A CN 2010106097290A CN 201010609729 A CN201010609729 A CN 201010609729A CN 102103858 A CN102103858 A CN 102103858A
- Authority
- CN
- China
- Prior art keywords
- voice command
- voice
- stored
- tone
- based control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013507 mapping Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims description 19
- 230000000295 complement effect Effects 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 4
- 238000011022 operating instruction Methods 0.000 abstract 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
- Lock And Its Accessories (AREA)
Abstract
本发明涉及一种控制方法及系统,尤其是涉及一种基于语音的控制方法及系统。本发明预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系;操作人员发出语音命令;将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配;如果存在相匹配的语音命令,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,语音命令无效。本发明无需手动输入操作指令,通过语音便可控制设备的启动或运行,操作方便。
Description
技术领域
本发明涉及一种控制方法及系统,尤其是涉及一种基于语音的控制方法及系统。
背景技术
在利用操作指令控制设备运行的应用场合,常常是通过输入操作指令的方式来启动设备的运行。一旦非法人员获取了操作指令,便可以合法身份来操作设备,安全性较差。例如,密码门禁系统,当操作人员输入正确的密码后,门便会开启,即只认密码不认人。显然,这种门禁系统的安全性无法得到保障。
如果采用语音来控制设备的运行,不但无需输入操作指令,而且兼具身份识别的能力,无疑能够提高系统的安全性。现有的语音识别系统能够识别出语音的语义内容,但识别过程较为复杂,识别效率也相对较低,不适合在此应该场合下使用。而且,操作指令大都相对简单,没有必要采用现有的较为复杂的语音识别系统。
发明内容
针对现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种操作方便、安全性好的基于语音的控制方法及系统。
为解决上述技术问题,本发明采用的技术方案如下:
一种基于语音的控制方法,包括以下步骤:
(1)预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系;
(2)操作人员发出语音命令;
(3)将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配;如果存在相匹配的语音命令,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,语音命令无效。
如上所述的基于语音的控制方法,其中,波形特征包括音调和波表。
如上所述的基于语音的控制方法,步骤(3)中所述将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配的方法如下:
(a)采集操作人员发出的语音命令;
(b)提取所述语音命令的音调;
(c)与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(d)提取语音命令的波表;
(e)与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败。
如上所述的基于语音的控制方法,其中,在采集操作人员发出的语音命令后,提取语音命令的音调之前,还包括对采集的语音命令进行去噪处理的步骤。
如上所述的基于语音的控制方法,步骤(1)中,将所述语音命令分成若干节,存储每一节语音命令的波形特征。步骤(3)中,如果每一节语音命令的波形特征均与预存储的相对应节的语音命令的波形特征相匹配,则获取该语音命令对应的操作指令。
一种基于语音的控制系统,包括用于预存储语音命令、语音命令的波形特征以及操作指令三者之间映射关系的预存储装置;
用于匹配操作人员发出的语音命令的波形特征与预存储的语音命令的波形特征的匹配装置;
用于获取相匹配的语音命令对应的操作指令的获取装置;
以及用于执行获取的操作指令的执行装置。
如上所述的基于语音的控制系统,其中,匹配装置包括用于采集操作人员发出的语音命令的采集单元;
用于提取语音命令音调的音调提取单元;
用于匹配提取的音调与预存储的音调的音调匹配单元;
用于提取语音命令波表的波表提取单元;
用于匹配提取的波表与预存储的波表的波表匹配单元。
如上所述的基于语音的控制系统,其中,匹配装置还包括用于对采集的语音命令进行去噪处理的去噪单元。
本发明所述方法及系统,无需手动输入操作指令,通过语音便可控制设备的启动或运行,操作方便。而且,通过语音可以判断出当前操作人员是否是合法的操作人员,避免了非法操作人员的非法操作,提高了安全性。
附图说明
图1是具体实施方式中基于语音的控制系统的结构框图;
图2是具体实施方式中基于语音的控制方法的流程图;
图3是具体实施方式中语音的波形特征匹配方法的流程图。
具体实施方式
下面结合具体实施方式和附图对本发明进行详细描述。
如图1所示,本实施方式中基于语音的控制系统包括预存储装置11,与预存储装置连接的匹配装置12,与预存储装置11和匹配装置12连接的获取装置13,以及与获取装置13连接的执行装置14。其中,匹配装置12包括采集单元121、去噪单元122、音调提取单元123、音调匹配单元124、波表提取单元125和波表匹配单元126。
预存储装置11用于预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系。
匹配装置12用于匹配操作人员发出的语音命令的波形特征与预存储的语音命令的波形特征,所述波形特征包括音调和波表。其中,采集单元121用于采集操作人员发出的语音命令。去噪单元122用于对采集的语音命令进行去噪处理。音调提取单元123用于提取语音命令的音调。音调匹配单元124匹配提取的音调与预存储的音调。波表提取单元125提取语音命令的波表。波表匹配单元126用于匹配提取的波表与预存储的波表。
获取装置13用于获取相匹配的语音命令对应的操作指令。
执行装置14用于执行获取的操作指令。
如图2所示,基于图1所示系统的控制方法包括以下步骤:
(1)预存储装置11预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系。
所述语音命令的波形特征包括音调和波表,可以将语音命令、语音命令的音调和波表及相对应的操作指令预存储在如下表头结构的映射表中。
语音命令 | 语音命令音调 | 语音命令波表 | 操作指令 |
(2)操作人员发出语音命令。
(3)匹配装置12将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配;如果存在相匹配的语音命令,则获取装置13根据所述映射关系获取相匹配的语音命令对应的操作指令后由执行装置14执行该操作指令;否则,语音命令无效。
如图3所示,具体的匹配方法如下:
(a)采集单元121采集操作人员发出的语音命令;
(b)去噪单元122对采集的语音命令进行去噪处理;
(c)音调提取单元123提取采集的语音命令的音调;
(d)音调匹配单元124与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(e)波表提取单元125提取语音命令的波表;
(f)波表匹配单元126与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败。
优选的,将语音命令分成若干节,存储每一节语音命令的波形特征,其映射表的表头结构如下所示:
操作人员发出所有节语音命令,每节语音命令间隔适当的时间。匹配装置12采集每一节语音命令,依次匹配每一节语音命令的音调和波表特征,如果每一节语音命令的波形特征均与预存储的相对应节的语音命令的波形特征相匹配,则获取该语音命令对应的操作指令。如果有一节语音命令的音调或波表不匹配,则匹配失败。
这种方式,由于操作人员并非一次性连续发出整个语音命令,因此,可降低整个语音命令被录音,利用录音进行操作控制的可能性,提高了系统的安全性。
波形特征的具体匹配方法为现有技术,可以通过采集声音的波形,之后对其进行快速傅立叶变换(Fast Fourier Transform)得到声音波形的频谱,匹配频谱。也可以继续按照短时FFT算法或者时域滤波法处理,再检测与预先存储的波形特征是否匹配。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.一种基于语音的控制方法,包括以下步骤:
(1)预存储语音命令、语音命令的波形特征以及操作指令三者之间的映射关系;
(2)操作人员发出语音命令;
(3)将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配;如果存在相匹配的语音命令,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,语音命令无效。
2.如权利要求1所述的基于语音的控制方法,其特征在于:所述波形特征包括音调和波表。
3.如权利要求2所述的基于语音的控制方法,其特征在于:步骤(3)中所述将操作人员的语音命令的波形特征与预存储的语音命令的波形特征进行匹配的方法如下:
(a)采集操作人员发出的语音命令;
(b)提取所述语音命令的音调;
(c)与预存储的语音命令的音调进行匹配,如果存在相匹配的音调,则进入下一步,否则,匹配失败;
(d)提取语音命令的波表;
(e)与音调匹配的语音命令的波表进行匹配;如果相匹配,则匹配成功;否则,匹配失败。
4.如权利要求3所述的基于语音的控制方法,其特征在于:在采集操作人员发出的语音命令后,提取语音命令的音调之前,还包括对采集的语音命令进行去噪处理的步骤。
5.如权利要求1~4中任一项所述的基于语音的控制方法,其特征在于:步骤(1)中,将所述语音命令分成若干节,存储每一节语音命令的波形特征。
6.如权利要求5所述的基于语音的控制方法,其特征在于:步骤(3)中,如果每一节语音命令的波形特征均与预存储的相对应节的语音命令的波形特征相匹配,则获取该语音命令对应的操作指令。
7.一种基于语音的控制系统,包括用于预存储语音命令、语音命令的波形特征以及操作指令三者之间映射关系的预存储装置(11);
用于匹配操作人员发出的语音命令的波形特征与预存储的语音命令的波形特征的匹配装置(12);
用于获取相匹配的语音命令对应的操作指令的获取装置(13);
以及用于执行获取的操作指令的执行装置(14)。
8.如权利要求7所述的基于语音的控制系统,其特征在于:所述匹配装置(12)包括用于采集操作人员发出的语音命令的采集单元(121);
用于提取语音命令音调的音调提取单元(123);
用于匹配提取的音调与预存储的音调的音调匹配单元(124);
用于提取语音命令波表的波表提取单元(125);
用于匹配提取的波表与预存储的波表的波表匹配单元(126)。
9.如权利要求8所述的基于语音的控制系统,其特征在于:所述匹配装置(12)还包括用于对采集的语音命令进行去噪处理的去噪单元(122)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010106097290A CN102103858B (zh) | 2010-12-15 | 2010-12-15 | 一种基于语音的控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010106097290A CN102103858B (zh) | 2010-12-15 | 2010-12-15 | 一种基于语音的控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102103858A true CN102103858A (zh) | 2011-06-22 |
CN102103858B CN102103858B (zh) | 2013-07-24 |
Family
ID=44156575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010106097290A Expired - Fee Related CN102103858B (zh) | 2010-12-15 | 2010-12-15 | 一种基于语音的控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102103858B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105139853A (zh) * | 2015-08-13 | 2015-12-09 | 深圳市双平泰科技有限公司 | 一种体征检测装置的控制方法及装置 |
CN105723450A (zh) * | 2013-11-13 | 2016-06-29 | 谷歌公司 | 用于话语检测的包络比较 |
CN105739940A (zh) * | 2014-12-08 | 2016-07-06 | 中兴通讯股份有限公司 | 存储方法及装置 |
CN105765656A (zh) * | 2013-12-09 | 2016-07-13 | 高通股份有限公司 | 控制计算装置的语音辨识过程 |
CN105897686A (zh) * | 2015-12-21 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 智能电视语音管理用户账号方法及智能电视 |
CN105976814A (zh) * | 2015-12-10 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 头戴设备的控制方法和装置 |
CN109597657A (zh) * | 2017-09-29 | 2019-04-09 | 广州市动景计算机科技有限公司 | 针对目标应用的操作方法、装置及计算设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1316726A (zh) * | 2000-02-02 | 2001-10-10 | 摩托罗拉公司 | 语音识别的方法和装置 |
CN1400526A (zh) * | 2001-07-31 | 2003-03-05 | 明碁电通股份有限公司 | 语音控制系统及方法 |
-
2010
- 2010-12-15 CN CN2010106097290A patent/CN102103858B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1316726A (zh) * | 2000-02-02 | 2001-10-10 | 摩托罗拉公司 | 语音识别的方法和装置 |
CN1400526A (zh) * | 2001-07-31 | 2003-03-05 | 明碁电通股份有限公司 | 语音控制系统及方法 |
Non-Patent Citations (2)
Title |
---|
《语音信号处理》 20030331 赵力 语音识别 217,221 , * |
赵力: "《语音信号处理》", 31 March 2003 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105723450A (zh) * | 2013-11-13 | 2016-06-29 | 谷歌公司 | 用于话语检测的包络比较 |
CN105723450B (zh) * | 2013-11-13 | 2019-09-10 | 谷歌有限责任公司 | 用于话语检测的包络比较的方法和系统 |
CN105765656A (zh) * | 2013-12-09 | 2016-07-13 | 高通股份有限公司 | 控制计算装置的语音辨识过程 |
CN105739940A (zh) * | 2014-12-08 | 2016-07-06 | 中兴通讯股份有限公司 | 存储方法及装置 |
CN105139853A (zh) * | 2015-08-13 | 2015-12-09 | 深圳市双平泰科技有限公司 | 一种体征检测装置的控制方法及装置 |
CN105976814A (zh) * | 2015-12-10 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 头戴设备的控制方法和装置 |
CN105976814B (zh) * | 2015-12-10 | 2020-04-10 | 乐融致新电子科技(天津)有限公司 | 头戴设备的控制方法和装置 |
CN105897686A (zh) * | 2015-12-21 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 智能电视语音管理用户账号方法及智能电视 |
CN109597657A (zh) * | 2017-09-29 | 2019-04-09 | 广州市动景计算机科技有限公司 | 针对目标应用的操作方法、装置及计算设备 |
CN109597657B (zh) * | 2017-09-29 | 2022-04-29 | 阿里巴巴(中国)有限公司 | 针对目标应用的操作方法、装置及计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102103858B (zh) | 2013-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102103858B (zh) | 一种基于语音的控制方法及系统 | |
WO2019137066A1 (zh) | 电器控制方法及装置 | |
CN104123939A (zh) | 基于变电站巡检机器人的语音交互控制方法 | |
CN104517607A (zh) | 滤除语音控制电器中的噪声的方法及语音控制电器 | |
CN105575391A (zh) | 声纹信息管理方法、装置以及身份认证方法、系统 | |
CN102005070A (zh) | 一种语音识别门禁系统 | |
CN105357006A (zh) | 一种基于声纹特征进行安全认证的方法及设备 | |
CN106847281A (zh) | 基于语音模糊识别技术的智能家居语音控制系统及方法 | |
CN106127896A (zh) | 一种智能门锁控制系统及方法 | |
CN104538034A (zh) | 一种语音识别方法及系统 | |
CN102930869A (zh) | 利用声学指纹鉴别发令人身份的语音操作控制装置及方法 | |
CN104142831B (zh) | 应用程序搜索方法及装置 | |
CN103106061A (zh) | 语音输入方法和装置 | |
CN104517066A (zh) | 一种文件夹加密方法 | |
WO2014173325A1 (zh) | 喉音识别方法及装置 | |
EP2261831A3 (en) | Biometrics authentication method and client terminal and authentication server used for biometrics authentication | |
CN103730121A (zh) | 一种伪装声音的识别方法及装置 | |
CN110488675A (zh) | 一种基于动态规整算法的变电站声信号特征提取方法 | |
CN108172220A (zh) | 一种新型语音除噪方法 | |
CN110111794A (zh) | 应用程序的启动方法、装置、计算机设备及存储介质 | |
CN105741841A (zh) | 语音控制方法及电子设备 | |
CN104984472A (zh) | 基于语音识别的镇痛控制方法及其装置 | |
CN108091327A (zh) | 一种智能语音设备控制方法 | |
CN106340299A (zh) | 一种复杂环境下的说话人识别系统及方法 | |
CN102831890A (zh) | 一种对文本无关的声纹进行识别的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130724 Termination date: 20141215 |
|
EXPY | Termination of patent right or utility model |