CN102945671A - 语音识别方法 - Google Patents
语音识别方法 Download PDFInfo
- Publication number
- CN102945671A CN102945671A CN201210426312XA CN201210426312A CN102945671A CN 102945671 A CN102945671 A CN 102945671A CN 201210426312X A CN201210426312X A CN 201210426312XA CN 201210426312 A CN201210426312 A CN 201210426312A CN 102945671 A CN102945671 A CN 102945671A
- Authority
- CN
- China
- Prior art keywords
- voice command
- recognition result
- user
- voice
- enter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明涉及语音技术。本发明解决了现有语音识别中容易误识别导致误操作的问题,提供了一种语音识别方法,其技术方案可概括为:通过加入激活词,使在未接收到激活词的情况下,语音设备不进行处理。本发明的有益效果是,有效避免了误操作,适用于带语音控制的设备。
Description
技术领域
本发明涉及语音技术,特别涉及语音识别的技术。
背景技术
如今,随着信息技术的高速发展,越来越多的智能技术被广泛应用到家用电器及其它设备上,智能技术,可以说是未来家用电器的发展趋势,近些年,智能家电在我们身边随处可见,如互联网电视机等,空调的智能化也在这个大浪潮中逐渐推进,带有智能控温、自动调速等功能的空调在市场上已不鲜见,语音识别也是一种重要的智能技术,将其运用到家用电器上能极大提升用户体验,方便不同用户群使用。语音识别是一门交叉学科,近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,它已经逐渐进入工业、家用电器、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域,苹果公司的iPhone4S采用的Siri语音控制功能则是成功的代表之作,语音识别所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令,语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。嵌入式设备往往有其特殊的运行环境,自身运行的噪音和周围的环境噪音会对语音识别效果产生较大影响,造成误识别,最终导致对设备的误操作,如采用遥控器或手机等辅助设备进行近距离语音识别,可在一定程度上减轻噪声带来的影响,提高一定的识别率,但无法根除误操作,另外,这种方案过分依赖辅助设备,一旦辅助设备出现问题或辅助设备不能连接主设备,则语音识别就不能使主设备正常工作,同时辅助设备也可能会增加产品成本。
发明内容
本发明的目的是克服目前语音识别中容易误识别导致误操作的缺点,提供一种语音识别方法。
本发明解决其技术问题,采用的技术方案是,语音识别方法,其特征在于,包括以下步骤:
步骤1、预先定义至少一个激活词;
步骤2、用户向语音引擎输入语音数据;
步骤3、语音引擎读取语音数据,并判断识别的语音数据中是否包含激活词,若是则向系统返回识别结果,进入下一步,若不是则不再进行处理,回到步骤2;
步骤4、系统根据识别结果中的语音命令选择相应的处理方式处理。
具体的,步骤3中,所述识别结果为一个或多个语音命令或无结果。
进一步的,所述识别结果为多个语音命令时,识别结果中的语音命令按照可能性高低依次排放。
具体的,步骤4包括以下步骤:
步骤41、系统判断识别结果为一个语音命令或多个语音命令或无结果,若为一个语音命令则将其选为当前语音命令并进入步骤45,若为多个语音命令则进入步骤42,若无结果则回到步骤2;
步骤42、系统选择识别结果中第一个语音命令为当前语音命令并向用户进行语音播报;
步骤43、用户选择播报的语音命令是否为所需语音命令,若是或等待一定时间后用户无回应则进入步骤45,若不是则进入步骤44;
步骤44、系统选择识别结果中下一个语音命令为当前语音命令并向用户进行语音播报,回到步骤43;
步骤45、系统按照当前语音命令对应的处理方式进行处理。
再进一步的,步骤43中,所述一定时间由软件开发者通过调试选择。
具体的,步骤1包括以下步骤:
步骤11、预先定义至少一个激活词,并在系统中设置循环数及最大循环数。
步骤42包括以下步骤:
步骤421、系统将循环数置为0,选择识别结果中第一个语音命令为当前语音命令并向用户进行语音播报;
步骤44包括以下步骤:
步骤441、系统提示用户是否重新输入命令,并判断在一段时间内用户是否重新输入命令,若是则回到步骤3,若不是则进入步骤442;
步骤442、系统判断循环数是否达到最大循环数,若是则回到步骤421,若不是则进入步骤443;
步骤443、系统判断识别结果中是否还有下一个语音命令,若是则进入步骤444,若不是则回到步骤421;
步骤444、系统将循环数加1,选择识别结果中下一个语音命令为当前语音命令并向用户进行语音播报,回到步骤43。
具体的,步骤11中,所述最大循环数由软件开发者通过调试选择。
再进一步的,步骤441中,所述一段时间由软件开发者通过调试选择。
本发明的有益效果是,通过上述语音识别方法,由于加入激活词,在用户未说激活词或语音引擎未接收到激活词的情况下,系统不进行处理,有效避免了误识别和误操作,提高了语音识别操作设备的准确性和有效性。
具体实施方式
下面结合实施例,详细描述本发明的技术方案。
本发明所述的语音识别方法为:首先预先定义至少一个激活词,使用时,用户向语音引擎输入语音数据,然后语音引擎读取语音数据,并判断识别的语音数据中是否包含激活词,若不是则不再进行处理,回到用户向语音引擎输入语音数据那一步等待语音输入,若是则向系统返回识别结果,系统再根据识别结果中的语音命令选择相应的处理方式处理。
实施例
本例的语音识别方法中,识别结果可以为一个或多个语音命令或无结果。
首先预先定义至少一个激活词,使用时,用户向语音引擎输入语音数据,然后语音引擎读取语音数据,并判断识别的语音数据中是否包含激活词,若不是则不再进行处理,回到用户向语音引擎输入语音数据那一步等待语音输入,若是则向系统返回识别结果,识别结果可以为一个或多个语音命令或无结果,当识别结果为多个语音命令时,识别结果中的语音命令按照可能性高低依次排放,系统再根据识别结果中的语音命令选择相应的处理方式处理,具体的处理方式为:系统首先判断识别结果为一个语音命令或多个语音命令或无结果,若为一个语音命令则将其选为当前语音命令并按照当前语音命令对应的处理方式进行处理,若无结果则回到用户向语音引擎输入语音数据那一步等待语音输入,若为多个语音命令则系统选择识别结果中第一个语音命令为当前语音命令并向用户进行语音播报,然后用户选择播报的语音命令是否为所需语音命令,若是或等待一定时间后用户无回应则系统按照当前语音命令对应的处理方式进行处理,这里的一定时间由软件开发者通过调试选择,如3秒等,若不是则系统选择识别结果中下一个语音命令为当前语音命令并向用户进行语音播报,回到用户选择播报的语音命令是否为所需语音命令那一步。
在处理多个识别结果时,若预先在系统中设置有循环数及最大循环数,还可以具体采用以下方式:
系统将循环数置为0,选择识别结果中第一个语音命令为当前语音命令并向用户进行语音播报,然后用户选择播报的语音命令是否为所需语音命令,若是或等待一定时间后用户无回应则系统按照当前语音命令对应的处理方式进行处理,若不是则系统提示用户是否重新输入命令,并判断在一段时间内用户是否重新输入命令,若是则回到语音引擎读取语音数据那一步,若不是则系统判断循环数是否达到最大循环数,若是则回到系统将循环数置为0那一步,若不是则系统判断识别结果中是否还有下一个语音命令,若不是则回到系统将循环数置为0那一步,若是则系统将循环数加1,选择识别结果中下一个语音命令为当前语音命令并向用户进行语音播报,回到用户选择播报的语音命令是否为所需语音命令那一步。这里,最大循环数由软件开发者通过调试选择,如3~5次,一段时间由软件开发者通过调试选择,如3秒等。
Claims (8)
1.语音识别方法,其特征在于,包括以下步骤:
步骤1、预先定义至少一个激活词;
步骤2、用户向语音引擎输入语音数据;
步骤3、语音引擎读取语音数据,并判断识别的语音数据中是否包含激活词,若是则向系统返回识别结果,进入下一步,若不是则不再进行处理,回到步骤2;
步骤4、系统根据识别结果中的语音命令选择相应的处理方式处理。
2.根据权利要求1所述语音识别方法,其特征在于,步骤3中,所述识别结果为一个或多个语音命令或无结果。
3.根据权利要求2所述语音识别方法,其特征在于,所述识别结果为多个语音命令时,识别结果中的语音命令按照可能性高低依次排放。
4.根据权利要求3所述语音识别方法,其特征在于,步骤4包括以下步骤:
步骤41、系统判断识别结果为一个语音命令或多个语音命令或无结果,若为一个语音命令则将其选为当前语音命令并进入步骤45,若为多个语音命令则进入步骤42,若无结果则回到步骤2;
步骤42、系统选择识别结果中第一个语音命令为当前语音命令并向用户进行语音播报;
步骤43、用户选择播报的语音命令是否为所需语音命令,若是或等待一定时间后用户无回应则进入步骤45,若不是则进入步骤44;
步骤44、系统选择识别结果中下一个语音命令为当前语音命令并向用户进行语音播报,回到步骤43;
步骤45、系统按照当前语音命令对应的处理方式进行处理。
5.根据权利要求4所述语音识别方法,其特征在于,步骤43中,所述一定时间由软件开发者通过调试选择。
6.根据权利要求4或5所述语音识别方法,其特征在于,步骤1包括以下步骤:
步骤11、预先定义至少一个激活词,并在系统中设置循环数及最大循环数。
步骤42包括以下步骤:
步骤421、系统将循环数置为0,选择识别结果中第一个语音命令为当前语音命令并向用户进行语音播报;
步骤44包括以下步骤:
步骤441、系统提示用户是否重新输入命令,并判断在一段时间内用户是否重新输入命令,若是则回到步骤3,若不是则进入步骤442;
步骤442、系统判断循环数是否达到最大循环数,若是则回到步骤421,若不是则进入步骤443;
步骤443、系统判断识别结果中是否还有下一个语音命令,若是则进入步骤444,若不是则回到步骤421;
步骤444、系统将循环数加1,选择识别结果中下一个语音命令为当前语音命令并向用户进行语音播报,回到步骤43。
7.根据权利要求6所述语音识别方法,其特征在于,步骤11中,所述最大循环数由软件开发者通过调试选择。
8.根据权利要求6所述语音识别方法,其特征在于,步骤441中,所述一段时间由软件开发者通过调试选择。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210426312XA CN102945671A (zh) | 2012-10-31 | 2012-10-31 | 语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210426312XA CN102945671A (zh) | 2012-10-31 | 2012-10-31 | 语音识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102945671A true CN102945671A (zh) | 2013-02-27 |
Family
ID=47728609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210426312XA Pending CN102945671A (zh) | 2012-10-31 | 2012-10-31 | 语音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102945671A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853703A (zh) * | 2014-02-19 | 2014-06-11 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN105659619A (zh) * | 2013-10-15 | 2016-06-08 | 三星电子株式会社 | 图像处理装置及其控制方法 |
CN106949700A (zh) * | 2013-06-25 | 2017-07-14 | 东芝生活电器株式会社 | 冰箱 |
CN107665708A (zh) * | 2016-07-29 | 2018-02-06 | 科大讯飞股份有限公司 | 智能语音交互方法及系统 |
CN107886947A (zh) * | 2017-10-19 | 2018-04-06 | 珠海格力电器股份有限公司 | 一种图像处理的方法以及装置 |
CN107919124A (zh) * | 2017-12-22 | 2018-04-17 | 北京小米移动软件有限公司 | 设备唤醒方法及装置 |
CN107949880A (zh) * | 2015-09-09 | 2018-04-20 | 三菱电机株式会社 | 车载用语音识别装置以及车载设备 |
CN110100277A (zh) * | 2016-12-15 | 2019-08-06 | 三星电子株式会社 | 语音识别方法和装置 |
CN110176233A (zh) * | 2019-04-28 | 2019-08-27 | 青岛海尔空调器有限总公司 | 空调语音控制的方法、装置及计算机存储介质 |
CN113259736A (zh) * | 2021-05-08 | 2021-08-13 | 深圳市康意数码科技有限公司 | 一种语音控制电视机的方法及电视机 |
CN114860912A (zh) * | 2022-05-20 | 2022-08-05 | 马上消费金融股份有限公司 | 数据处理方法、装置、电子设备和存储介质 |
US11687319B2 (en) | 2016-12-15 | 2023-06-27 | Samsung Electronics Co., Ltd. | Speech recognition method and apparatus with activation word based on operating environment of the apparatus |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005018442A (ja) * | 2003-06-26 | 2005-01-20 | Sharp Corp | 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体 |
CN1708783A (zh) * | 2002-11-02 | 2005-12-14 | 皇家飞利浦电子股份有限公司 | 用于语音识别的方法和系统 |
CN101426047A (zh) * | 2007-10-31 | 2009-05-06 | 陈修志 | 一种智能声控电话 |
CN102105929A (zh) * | 2008-07-30 | 2011-06-22 | 三菱电机株式会社 | 声音识别装置 |
CN102138175A (zh) * | 2008-07-02 | 2011-07-27 | 谷歌公司 | 具有并行识别任务的语音识别 |
CN102404330A (zh) * | 2011-11-30 | 2012-04-04 | 上海博泰悦臻电子设备制造有限公司 | 多用户同时在线管理方法和系统 |
CN102682771A (zh) * | 2012-04-27 | 2012-09-19 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
-
2012
- 2012-10-31 CN CN201210426312XA patent/CN102945671A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1708783A (zh) * | 2002-11-02 | 2005-12-14 | 皇家飞利浦电子股份有限公司 | 用于语音识别的方法和系统 |
JP2005018442A (ja) * | 2003-06-26 | 2005-01-20 | Sharp Corp | 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体 |
CN101426047A (zh) * | 2007-10-31 | 2009-05-06 | 陈修志 | 一种智能声控电话 |
CN102138175A (zh) * | 2008-07-02 | 2011-07-27 | 谷歌公司 | 具有并行识别任务的语音识别 |
CN102105929A (zh) * | 2008-07-30 | 2011-06-22 | 三菱电机株式会社 | 声音识别装置 |
CN102404330A (zh) * | 2011-11-30 | 2012-04-04 | 上海博泰悦臻电子设备制造有限公司 | 多用户同时在线管理方法和系统 |
CN102682771A (zh) * | 2012-04-27 | 2012-09-19 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106949700A (zh) * | 2013-06-25 | 2017-07-14 | 东芝生活电器株式会社 | 冰箱 |
CN105659619A (zh) * | 2013-10-15 | 2016-06-08 | 三星电子株式会社 | 图像处理装置及其控制方法 |
US10068572B2 (en) | 2013-10-15 | 2018-09-04 | Samsung Electronics Co., Ltd. | Image processing apparatus having a voice control function and control method thereof |
CN105659619B (zh) * | 2013-10-15 | 2019-07-26 | 三星电子株式会社 | 图像处理装置及其控制方法 |
CN103853703A (zh) * | 2014-02-19 | 2014-06-11 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN107949880A (zh) * | 2015-09-09 | 2018-04-20 | 三菱电机株式会社 | 车载用语音识别装置以及车载设备 |
CN107665708B (zh) * | 2016-07-29 | 2021-06-08 | 科大讯飞股份有限公司 | 智能语音交互方法及系统 |
CN107665708A (zh) * | 2016-07-29 | 2018-02-06 | 科大讯飞股份有限公司 | 智能语音交互方法及系统 |
CN110100277B (zh) * | 2016-12-15 | 2024-01-23 | 三星电子株式会社 | 语音识别方法和装置 |
CN110100277A (zh) * | 2016-12-15 | 2019-08-06 | 三星电子株式会社 | 语音识别方法和装置 |
US11687319B2 (en) | 2016-12-15 | 2023-06-27 | Samsung Electronics Co., Ltd. | Speech recognition method and apparatus with activation word based on operating environment of the apparatus |
CN107886947A (zh) * | 2017-10-19 | 2018-04-06 | 珠海格力电器股份有限公司 | 一种图像处理的方法以及装置 |
CN107919124A (zh) * | 2017-12-22 | 2018-04-17 | 北京小米移动软件有限公司 | 设备唤醒方法及装置 |
CN110176233A (zh) * | 2019-04-28 | 2019-08-27 | 青岛海尔空调器有限总公司 | 空调语音控制的方法、装置及计算机存储介质 |
CN113259736A (zh) * | 2021-05-08 | 2021-08-13 | 深圳市康意数码科技有限公司 | 一种语音控制电视机的方法及电视机 |
CN114860912A (zh) * | 2022-05-20 | 2022-08-05 | 马上消费金融股份有限公司 | 数据处理方法、装置、电子设备和存储介质 |
CN114860912B (zh) * | 2022-05-20 | 2023-08-29 | 马上消费金融股份有限公司 | 数据处理方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102945671A (zh) | 语音识别方法 | |
CN106782536B (zh) | 一种语音唤醒方法及装置 | |
CN109326289B (zh) | 免唤醒语音交互方法、装置、设备及存储介质 | |
CN102999161B (zh) | 一种语音唤醒模块的实现方法及应用 | |
CN105654949B (zh) | 一种语音唤醒方法及装置 | |
CN105336324A (zh) | 一种语种识别方法及装置 | |
CN102298442A (zh) | 手势识别设备、手势识别方法及程序 | |
CN107767861A (zh) | 语音唤醒方法、系统及智能终端 | |
CN102842306A (zh) | 语音控制方法及装置、语音响应方法及装置 | |
CN109308897B (zh) | 语音控制方法、模块、家电设备、系统和计算机存储介质 | |
CN103632664B (zh) | 一种语音识别的方法及电子设备 | |
CN103811003A (zh) | 一种语音识别方法以及电子设备 | |
CN111197841A (zh) | 控制方法、装置、遥控终端、空调器、服务器及存储介质 | |
CN109903758B (zh) | 音频处理方法、装置及终端设备 | |
CN106782529B (zh) | 语音识别的唤醒词选择方法及装置 | |
CN103594088A (zh) | 一种信息处理方法和电子设备 | |
CN105825848A (zh) | 一种语音识别方法、装置及终端 | |
CN108564948A (zh) | 一种语音识别方法及电子设备 | |
CN102324241A (zh) | 具有语音控制功能的电子装置及语音控制方法 | |
CN111933108A (zh) | 一种智能网联终端智能语音交互系统自动化测试方法 | |
CN111627423A (zh) | Vad尾点检测方法、装置、服务器和计算机可读介质 | |
CN203027334U (zh) | 带闹钟的移动终端 | |
CN104111728A (zh) | 基于操作手势的语音指令输入方法及电子设备 | |
CN107977072B (zh) | 一种机器人使用的养成方法、养成专家系统及电子设备 | |
CN106531195A (zh) | 一种对话冲突检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130227 |