CN104423992A - 显示器语音辨识的启动方法 - Google Patents

显示器语音辨识的启动方法 Download PDF

Info

Publication number
CN104423992A
CN104423992A CN201310394242.9A CN201310394242A CN104423992A CN 104423992 A CN104423992 A CN 104423992A CN 201310394242 A CN201310394242 A CN 201310394242A CN 104423992 A CN104423992 A CN 104423992A
Authority
CN
China
Prior art keywords
speech recognition
display
starting method
phonetic order
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310394242.9A
Other languages
English (en)
Inventor
徐鸿旺
萧士杰
徐宥宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TPV Investment Co Ltd
TPV Technology Co Ltd
Original Assignee
TPV Investment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TPV Investment Co Ltd filed Critical TPV Investment Co Ltd
Priority to CN201310394242.9A priority Critical patent/CN104423992A/zh
Publication of CN104423992A publication Critical patent/CN104423992A/zh
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

一种显示器语音辨识的启动方法,显示器包括摄像头、扬声器及麦克风,显示器语音辨识的启动方法包括:当开启语音辨识功能时,开启摄像头采集影像,并进行影像辨识;当辨识到特定的手势时,控制扬声器降低声音音量或静音后,开启麦克风收录语音,并进行语音辨识;当辨识到语音指令时,根据辨识到的语音指令进行相应的控制动作;当辨识到离开语音辨识的语音指令时,或者当一段预定时间内没有辨识到语音指令时,结束语音辨识,并控制扬声器恢复声音音量。本发明可减少显示器本身播放声音的干扰,改善指令输入时间长和使用复杂度高的缺点,且设计符合使用者的使用习惯。

Description

显示器语音辨识的启动方法
技术领域
本发明有关于一种语音辨识的启动方法,且特别是有关于一种显示器语音辨识的启动方法。
背景技术
对于目前的显示器,如计算机屏幕(monitor)或电视而言,语音辨识功能已经越来越普及。而常见的显示器语音辨识的启动方法有三种,分别是“Free Talk(直接输入语音指令)”、“Voice Trigger to Talk(先语音启动输入再输入语音指令)”和“Push to Talk(先按键启动输入再输入语音指令)”。在“Free Talk”方法中,显示器随时进行收录语音和语音辨识。在“Voice Trigger to Talk”方法中,显示器随时进行收录语音并采用两阶段语音辨识,第一阶段只辨识几个预设的语音指令,当辨识到有预设的语音指令出现时,先降低显示器声音音量或静音,再进入第二阶段等候并辨识完整的语音指令。在“Push to Talk”方法中,显示器在辨识到有遥控器特定按键被按压后,先降低显示器声音音量或静音,再进行收录语音和语音辨识。
在这三种显示器语音辨识的启动方法中,“Free Talk”是使用者最容易接受的方法,但因显示器本身正在播放的影音内容所发出的声音干扰,往往会造成辨识失败而误动作或无动作。“Voice Trigger to Talk”采用两阶段语音辨识,可以减少“Free Talk”方法中显示器本身播放声音的干扰,但因为等于要辨识两次语音指令,使得整个指令输入时间长且使用复杂度高。“Push to Talk”既可以减少“Free Talk”方法中显示器本身播放声音的干扰,也改善了“Voice Trigger to Talk”方法中指令输入时间长和使用复杂度高的缺点,但这样的设计违反使用者的使用习惯,因为当使用者手持遥控器时,直接使用遥控器来输入指令,又快又直觉,此时使用语音辨识来输入语音指令,相较之下反而反应慢且有时会辨识错误。
发明内容
本发明的目的在提出一种显示器语音辨识的启动方法,可减少显示器本身播放声音的干扰,改善指令输入时间长和使用复杂度高的缺点,且设计符合使用者的使用习惯。
为达到上述目的,本发明提出一种显示器语音辨识的启动方法,该显示器包括一摄像头、一扬声器及一麦克风,该显示器语音辨识的启动方法包括:
当开启语音辨识功能时,开启该摄像头采集影像,并进行影像辨识;
当辨识到特定的手势时,控制该扬声器降低声音音量或静音后,开启该麦克风收录语音,并进行语音辨识;
当辨识到语音指令时,根据辨识到的语音指令进行相应的控制动作;及
当辨识到离开语音辨识的语音指令时,或者当一段预定时间内没有辨识到语音指令时,结束语音辨识,并控制该扬声器恢复声音音量。
在本发明一示意性实施方案中,该显示器语音辨识的启动方法还包括:当没有辨识到特定的手势时,控制该摄像头继续采集影像,并进行影像辨识。
在本发明一示意性实施方案中,该显示器语音辨识的启动方法还包括:当还没有结束语音辨识时,控制该麦克风继续收录语音,并进行语音辨识。
在本发明一示意性实施方案中,该显示器语音辨识的启动方法还包括:当结束语音辨识时,还控制该麦克风停止收录语音。
在本发明一示意性实施方案中,特定的手势包括挥手或握拳头。
在本发明一示意性实施方案中,该显示器包括计算机屏幕或电视。
本发明因采用在显示器辨识到特定的手势时,降低显示器声音音量或静音后,再进行收录语音和语音辨识,可减少显示器本身播放声音的干扰以提高辨识正确率,改善指令输入时间长和使用复杂度高的缺点,且利用手势辨识来启动语音辨识的设计更符合使用者的使用习惯。
为让本发明上述和其它目的、特征和优点能更明显易懂,下文特举具体实施方式,并配合附图,作详细说明如下。
附图说明
图1为显示器语音辨识的启动方法的一种示意性实施方式的流程图。
标号说明
S1:摄像头采集影像
S2:是否有特定的手势
S3:控制扬声器降低声音音量或静音
S4:麦克风收录语音,并进行语音辨识
S5:是否结束语音辨识
S6:控制扬声器恢复声音音量
S7:根据语音指令进行相应的控制动作。
具体实施方式
请参见图1,其为显示器语音辨识的启动方法的一种示意性实施方式的流程图。显示器可以是计算机屏幕、电视或其它功能类型的显示器,但其必须内建或外接有摄像头、扬声器及麦克风。在步骤S1,当显示器开启语音辨识功能时,显示器开启摄像头采集影像,并进行影像辨识。在步骤S2,显示器判断是否辨识到特定的手势,特定的手势可以设定是挥手、握拳头或其它类型的手势。
当显示器在步骤S2判断没有辨识到特定的手势时,显示器返回步骤S1控制摄像头继续采集影像,并进行影像辨识。当显示器在步骤S2判断辨识到特定的手势时,执行步骤S3,显示器先储存本身正在播放的影音内容使扬声器发出的声音的音量值,再控制扬声器降低声音音量或静音;接着,执行步骤S4,显示器开启麦克风收录语音,并进行语音辨识。
当显示器在步骤S4没有辨识到语音指令时,执行步骤S5,显示器判断是否一段预定时间内没有辨识到语音指令。当显示器在步骤S5判断没有辨识到语音指令的时长还没有达到该预定时间时,表示还没有结束语音辨识,故返回步骤S4,显示器控制麦克风继续收录语音,并进行语音辨识。当显示器在步骤S5判断已一段预定时间内没有辨识到语音指令时,表示要结束语音辨识,故接着执行步骤S6,显示器根据在步骤S3所储存的音量值控制扬声器恢复声音音量,然后返回步骤S1继续本流程。
当显示器在步骤S4辨识到语音指令时,执行步骤S7,显示器根据辨识到的语音指令进行相应的控制动作;接着,执行步骤S5,显示器判断是否结束语音辨识。显示器辨识到的语音指令例如可以是调整亮度、调整音量、切换频道、离开语音辨识或其它类型的语音指令。在步骤S7,当显示器辨识到的语音指令是离开语音辨识的语音指令时,显示器在接着执行的步骤S5中会因判断有离开语音辨识的语音指令而结束语音辨识,并执行步骤S6。在步骤S7,当显示器辨识到的语音指令是除了离开语音辨识以外的语音指令时,显示器在接着执行的步骤S5中会因判断有语音指令输入而将用于计时该预定时间的定时器重置以重新计时,并返回步骤S4继续进行收录语音和语音辨识。
换句话说,在步骤S5,当显示器判断辨识到离开语音辨识的语音指令时,或者当一段预定时间内没有辨识到语音指令时,显示器结束语音辨识,并执行步骤S6。在步骤S5,当显示器判断有除了离开语音辨识以外的语音指令时,显示器返回步骤S4继续进行收录语音和语音辨识。
综上所述,本发明因采用在显示器辨识到特定的手势时,降低显示器声音音量或静音后,再进行收录语音和语音辨识,可减少显示器本身播放声音的干扰以提高辨识正确率,改善指令输入时间长和使用复杂度高的缺点,且利用手势辨识来启动语音辨识的设计更符合使用者的使用习惯。
虽然本发明已以具体实施方式揭露如上,然其并非用以限定本发明,任何熟习此技艺者,在不脱离本发明的精神和范围内,当可作些许更动与润饰,因此本发明的保护范围当视权利要求书所界定者为准。 

Claims (6)

1.一种显示器语音辨识的启动方法,该显示器包括一摄像头、一扬声器及一麦克风,该显示器语音辨识的启动方法包括:
当开启语音辨识功能时,开启该摄像头采集影像,并进行影像辨识;
当辨识到特定的手势时,控制该扬声器降低声音音量或静音后,开启该麦克风收录语音,并进行语音辨识;
当辨识到语音指令时,根据辨识到的语音指令进行相应的控制动作;及
当辨识到离开语音辨识的语音指令时,或者当一段预定时间内没有辨识到语音指令时,结束语音辨识,并控制该扬声器恢复声音音量。
2.如权利要求1所述的显示器语音辨识的启动方法,其中,该显示器语音辨识的启动方法还包括:
当没有辨识到特定的手势时,控制该摄像头继续采集影像,并进行影像辨识。
3.如权利要求1所述的显示器语音辨识的启动方法,其中,该显示器语音辨识的启动方法还包括:
当还没有结束语音辨识时,控制该麦克风继续收录语音,并进行语音辨识。
4.如权利要求1所述的显示器语音辨识的启动方法,其中,该显示器语音辨识的启动方法还包括:
当结束语音辨识时,还控制该麦克风停止收录语音。
5.如权利要求1所述的显示器语音辨识的启动方法,其中,特定的手势包括挥手或握拳头。
6.如权利要求1所述的显示器语音辨识的启动方法,其中,该显示器包括计算机屏幕或电视。
CN201310394242.9A 2013-09-03 2013-09-03 显示器语音辨识的启动方法 Pending CN104423992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310394242.9A CN104423992A (zh) 2013-09-03 2013-09-03 显示器语音辨识的启动方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310394242.9A CN104423992A (zh) 2013-09-03 2013-09-03 显示器语音辨识的启动方法

Publications (1)

Publication Number Publication Date
CN104423992A true CN104423992A (zh) 2015-03-18

Family

ID=52973073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310394242.9A Pending CN104423992A (zh) 2013-09-03 2013-09-03 显示器语音辨识的启动方法

Country Status (1)

Country Link
CN (1) CN104423992A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820556A (zh) * 2015-05-06 2015-08-05 广州视源电子科技股份有限公司 唤醒语音助手的方法及装置
CN106325481A (zh) * 2015-06-30 2017-01-11 展讯通信(天津)有限公司 一种非接触式控制系统及方法以及移动终端
CN106610771A (zh) * 2016-12-12 2017-05-03 广州神马移动信息科技有限公司 一种语音识别界面的生成和自适应旋转的方法和装置
CN108271078A (zh) * 2018-03-07 2018-07-10 康佳集团股份有限公司 通过手势识别的语音唤醒方法、智能电视及存储介质
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
CN113853234A (zh) * 2019-04-03 2021-12-28 Jk控股股份有限公司 用于作用于身体的至少部分上的装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060259305A1 (en) * 2005-05-13 2006-11-16 Nokia Corporation Method and device for recovering interrupted voice input
CN103209369A (zh) * 2012-01-16 2013-07-17 晨星软件研发(深圳)有限公司 电子装置的声控系统以及相关控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060259305A1 (en) * 2005-05-13 2006-11-16 Nokia Corporation Method and device for recovering interrupted voice input
CN103209369A (zh) * 2012-01-16 2013-07-17 晨星软件研发(深圳)有限公司 电子装置的声控系统以及相关控制方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820556A (zh) * 2015-05-06 2015-08-05 广州视源电子科技股份有限公司 唤醒语音助手的方法及装置
CN106325481A (zh) * 2015-06-30 2017-01-11 展讯通信(天津)有限公司 一种非接触式控制系统及方法以及移动终端
CN106610771A (zh) * 2016-12-12 2017-05-03 广州神马移动信息科技有限公司 一种语音识别界面的生成和自适应旋转的方法和装置
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
CN108271078A (zh) * 2018-03-07 2018-07-10 康佳集团股份有限公司 通过手势识别的语音唤醒方法、智能电视及存储介质
CN113853234A (zh) * 2019-04-03 2021-12-28 Jk控股股份有限公司 用于作用于身体的至少部分上的装置

Similar Documents

Publication Publication Date Title
JP6811758B2 (ja) 音声対話方法、装置、デバイス及び記憶媒体
US10838765B2 (en) Task execution method for voice input and electronic device supporting the same
JP5819269B2 (ja) 電子装置及びその制御方法
JP6111030B2 (ja) 電子装置及びその制御方法
US10049665B2 (en) Voice recognition method and apparatus using video recognition
CN104423992A (zh) 显示器语音辨识的启动方法
US9953643B2 (en) Selective transmission of voice data
WO2017012511A1 (zh) 语音控制方法、装置及投影仪设备
JP2013037689A (ja) 電子装置及びその制御方法
JP2013041579A (ja) 電子装置及びその制御方法
JP2019161638A (ja) スマートテレビの制御モード切替方法、設備及びコンピュータプログラム
JP2014532933A (ja) 電子装置及びその制御方法
US12003804B2 (en) Information processing device, information processing method, and computer program
EP3933570A1 (en) Method and apparatus for controlling a voice assistant, and computer-readable storage medium
CN104615359A (zh) 对应用软件进行语音操作的方法及装置
WO2021196617A1 (zh) 一种语音交互方法、装置、电子设备及存储介质
CN104320688A (zh) 视频播放操控方法及装置
CN109616111B (zh) 一种基于语音识别的场景交互控制方法
US20210183388A1 (en) Voice recognition method and device, photographing system, and computer-readable storage medium
CN110047484A (zh) 一种语音识别交互方法、系统、设备和存储介质
CN105824427A (zh) 基于手势操作进行音量调节的方法及系统
CN113918077A (zh) 投影方法及投影控制方法和相关装置、投影仪、存储介质
CN114489331A (zh) 区别于按钮点击的隔空手势交互方法、装置、设备和介质
CN112243064B (zh) 音频处理方法及装置
CN108766427A (zh) 语音控制方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150318

WD01 Invention patent application deemed withdrawn after publication