CN103578474B - 一种语音控制方法、装置和设备 - Google Patents

一种语音控制方法、装置和设备 Download PDF

Info

Publication number
CN103578474B
CN103578474B CN201310512905.2A CN201310512905A CN103578474B CN 103578474 B CN103578474 B CN 103578474B CN 201310512905 A CN201310512905 A CN 201310512905A CN 103578474 B CN103578474 B CN 103578474B
Authority
CN
China
Prior art keywords
terminal
voice signal
microphone
preset state
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310512905.2A
Other languages
English (en)
Other versions
CN103578474A (zh
Inventor
曾健
刘新宇
刘宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201310512905.2A priority Critical patent/CN103578474B/zh
Publication of CN103578474A publication Critical patent/CN103578474A/zh
Application granted granted Critical
Publication of CN103578474B publication Critical patent/CN103578474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

本公开提供了一种语音控制方法,所述方法包括:当所述终端处于预设状态时,打开所述终端的麦克风;执行来自所述麦克风的语音信号所指示的操作。根据本公开,当终端处于预设状态时,打开终端的麦克风接收输入的语音信号,并响应该语音信号执行对应的操作,从而使得用户可以在与终端有一定的物理距离(如5米以内),或不触碰终端情况下,也能使用语音信号来控制终端。

Description

一种语音控制方法、装置和设备
技术领域
本公开涉及语音识别的技术领域,特别是涉及一种语音控制方法、一种语音控制装置和一种设备。
背景技术
随着科技的飞速发展以及终端设备智能化的影响,智能终端设备越来越普及。智能终端设备是指那些具有多媒体功能的智能设备,这些设备支持音频、视频、数据等方面的功能。目前很多智能终端设备已经具备了语音识别功能,能够识别用户的语音输入,并用合成语音或其他方式向用户输出结果。
以手机为例,用户打开手机,启动手机的语音识别程序,在语音识别程序提示用户输入语音信号后,麦克风开启,用户就可以对着麦克风输入语音信号,手机识别该语音信号,并向用户输出结果。然而,用户不在手机旁边的时候,就无法完成上述操作。
发明内容
本公开所要解决的技术问题是提供一种语音控制方法,使得用户在不触碰终端的情况下也能使用语音信号来控制终端。
相应的,本公开还提供了一种语音控制装置和一种设备,用以保证上述方法的实现及应用。
一方面,本公开提供了一种语音控制方法,用于终端中,所述方法包括:
当所述终端处于预设状态时,打开所述终端的麦克风;
执行来自所述麦克风的语音信号所指示的操作。
可选的,所述终端处于预设状态包括:所述终端处于充电状态,和/或,所述终端的当前位置参数为预设的位置阈值,和/或,所述终端的当前显示时间为预设的时间阈值。
可选的,所述当所述终端处于预设状态时,打开所述终端的麦克风的步骤包括:
确定是否感应到语音信号,并确定所述终端是否处于预设状态;
如果确定感应到语音信号且确定所述终端处于预设状态,打开所述终端的麦克风。
可选的,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
识别来自所述麦克风的语音信号,并根据识别结果生成控制信号;
根据所述控制信号执行操作。
可选的,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
连接互联网;
将来自所述麦克风的语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
根据所述识别结果生成控制信号;
根据所述控制信号执行操作。
可选的,所述方法还包括:当所述连接互联网失败时,输出语音提示。
另一方面,本公开提供一种语音控制装置,用于终端中,所述装置包括:
麦克风开启单元,用于在所述终端处于预设状态时,打开所述终端的麦克风;
语音信号执行单元,用于执行来自所述麦克风的语音信号所指示的操作。
可选的,所述终端处于预设状态包括:所述终端处于充电状态,和/或,所述终端的当前位置参数为预设的位置阈值,和/或,所述终端的当前显示时间为预设的时间阈值。
可选的,所述麦克风开启单元包括:
第一确定模块,用于确定是否感应到语音信号;
第二确定模块,用于确定所述终端是否处于预设状态;
麦克风打开模块,用于在感应到语音信号且确定所述终端处于预设状态时,打开所述终端的麦克风。
可选的,所述语音信号执行单元,包括:
识别模块,用于识别来自所述麦克风的语音信号;
执行模块,用于根据所述识别结果生成控制信号,并根据所述控制信号执行操作。
可选的,所述语音信号执行单元包括:
连接模块,用于连接互联网;
识别模块,用于将所述语音信号上传至云服务器中,所述云服务器用于识别所述语音信号;
执行模块,用于根据所述识别结果生成控制信号,并根据所述控制信号执行操作。
可选的,所述识别模块还用于在所述连接模块连接互联网失败时,输出语音提示。
又一方面,本公开提供一种设备,所述设备包括:
一个或多个处理器;
存储器;和
一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
当所述设备处于预设状态时,打开所述设备的麦克风;
执行来自所述麦克风的语音信号所指示的操作。
与背景技术相比,本公开的一些有益效果可以包括:
第一,在本公开中,在终端处于预设状态时,自动打开终端的麦克风,接收用户的语音信号,执行该语音信号所指示的操作,无需用户手动打开麦克风,使得用户可以在不触碰终端,或与终端有一定的物理距离的情况下,也能使用语音来控制终端的操作。
第二,在本公开中,通过将语音信号上传到云服务器,利用云服务器的强大的计算能力和存储空间,获得更准确和丰富的控制信号,当检测到网络连接失败时,还可以及时地提醒用户启用网络。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
图1是本公开提供的一种语音控制方法实施例一的示例性步骤流程图;
图2是本公开提供的一种语音控制方法实施例二的示例性步骤流程图;
图3是本公开提供的一种语音控制方法实施例三的示例性步骤流程图;
图4是本公开提供的一种语音识别装置的示例性结构框图;
图5是本公开提供的一种终端设备示例性结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
为使本公开的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本公开作进一步详细的说明。
本公开的核心构思之一在于,当终端处于预设状态时,可以开启麦克风接收输入的语音信号,并识别该语音信号为控制信号,依据控制信号执行对应的控制操作,从而使得用户可以在与终端有一定的物理距离(如5米以内),或不触碰终端情况下,也能使用语音信号来控制终端。
实施例一
参照图1,示出了本公开提供的一种语音控制方法实施例一的示例性步骤流程图,其中本实施例的语音控制方法用于终端中,可以由所述终端中的语音识别程序执行,所述终端可以包括智能终端,所述智能终端可以为具有多媒体功能的智能设备,这些设备支持音频、视频、数据等方面的功能,如可视电话、会议终端、内置多媒体功能的PC(personalcomputer,个人计算机)、手机、PDA(Personal Digital Assistant,掌上电脑)等,本实施例对终端的具体类型无需加以限制。
本实施例可以包括如下步骤。
在步骤101中,当所述终端处于预设状态时,打开所述终端的麦克风。
在步骤102中,执行来自所述麦克风的语音信号所指示的操作。
本实施例中的语音控制方法涉及语音识别技术,语音识别技术也被称为自动语音识别Automatic Speech Recognition(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。在本实施例中,当终端处于预设状态时,打开终端的麦克风接收输入的语音信号,并响应该语音信号执行对应的操作,从而使得用户可以在与终端有一定的物理距离(如5米以内),或不触碰终端情况下,也能使用语音信号来控制终端。
实施例二
参照图2,示出了本公开提供的一种语音控制方法实施例二的示例性步骤流程图,本实施例的语音控制方法可以用于终端中,终端可以包括麦克风和语音识别程序,该方法可以由语音识别程序执行。
本实施例可以包括如下步骤。
在步骤201中,当所述终端处于预设状态时,打开终端的麦克风。
在本实施例中,终端处于预设状态可以至少包括以下三种状态中的一种:
1、终端处于充电状态。
2、终端的当前位置参数为预设的位置阈值。其中,预设的位置阈值是指示用户指定地点的参数,如用户家中。该预设的位置阈值可以为GPS(Global Positioning System,全球定位系统)参数,也可以为Wifi热点标识,该预设的位置阈值存储在终端系统中,当获取到的当前位置参数为GPS参数时,则将当前获取的GPS参数与系统中预设的GPS参数比较,当获取到的当前位置参数为终端的Wifi热点标识时,则将当前获取的Wifi热点标识与终端预设的Wifi热点标识进行比较。
3、终端的当前显示时间为预设的时间阈值。预设的时间阈值可以根据用户的作息习惯自由设定(如夜间)。
需要说明的是,上述预设状态可以由用户来配置和指定,并且可以配置多个条件的结合,例如1+2,或1+3等等。当然,本领域技术人员也可以根据实际需要配置和指定其他的环境参数作为预设状态,本实施例对此不作限制。
当终端处于预设状态时,终端自动地打开麦克风,保持唤醒状态,并随时等待用户的语音信号输入。
步骤202,执行来自所述麦克风的语音信号所指示的操作。
本步骤中,生成所述语音信号的控制信号,根据所述控制信号执行操作。
在本实施例的一种实施方式中,可以在本地识别语音信号并执行语音信号所指示的操作,步骤202可以包括如下子步骤:
子步骤S11,识别来自所述麦克风的语音信号,并根据识别结果生成控制信号;
子步骤S12,根据所述控制信号执行操作。
在本实施例中,麦克风打开后,经由麦克风接收输入的语音信号,随后语音识别程序识别来自麦克风的语音信号,该语音识别程序一直处于开启状态并在后台运行,语音识别程序一直监听麦克风的状态,一旦发现麦克风接收语音信号,在接收到麦克风发送的语音信号后,就尝试识别该语音信号,并根据识别结果输出控制信号。
在实际应用中,语音识别程序将语音信号识别为控制信号的方法可以有很多,作为一种示例,语音识别程序接收所述语音信号后,可以在预置数据库中查找所述语音信号,预置数据库中存储有用户在先输入的语音信号与对应的控制信号的映射关系;若语音信号查找成功,则语音识别程序从所述预置数据库的映射关系中获取该语音信号对应的控制信号并输出。
在本实施例的另一种实施方式中,可以联网识别输入的语音信号并执行语音信号所指示的操作,所述步骤202可以包括以下子步骤:
子步骤S21,连接互联网;
子步骤S22,将来自所述麦克风的语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
子步骤S23,根据所述识别结果生成控制信号;
子步骤S24,根据所述控制信号执行操作。
由于云服务器端可以拥有更强大的计算能力和存储空间,将语音信号上传至云服务器中,由云服务器来识别语音信号,能够提供更好的识别结果。
在联网识别输入的语音信号时,如果当前终端又恰好没有联网(连接互联网失败),则语音识别程序输出语音提示,该语音提示可以为直接告诉用户当前未开启网络。
当然,上述从本地查找接收的语音信号,并获取与该语音信号匹配的控制信号的过程或将语音信号上传至云服务器中获取控制信号的过程仅仅是本公开的一种示例,实际上,本领域技术人员可以采用其他方式识别语音信号并获取语音信号对应的控制信号,如先提取语音信号中的关键信号,获取关键信号对应的数字信号并在预设的数据库中查找数据信号,获取该数字信号对应的控制信号,或可以基于声道模型和语音知识的方法、利用人工神经网络等方法实现语音信号识别和控制信号获取,本公开对此无需加以限制。
控制信号可以具体指示哪个应用程序执行何种控制操作。
例如接收到的语音信号为“现在几点了?”,语音识别程序识别该语音信号后输出的控制信号可以为“打开报时应用程序或时钟应用程序进行报时”,控制该报时应用程序或时钟应用程序通过终端的扩音器进行报时,如输出“现在时间:凌晨3点”的结果。
又如,接收到输入的语音信号为:“将早晨的闹钟推迟一小时”,语音识别程序识别该语音信号后输出的控制信号可以为“打开闹铃应用程序或时钟应用程序并调整闹铃”,控制闹铃应用程序或时钟应用程序的操作,如将闹铃从7点调到8点。
或如,当该终端为数字会议桌面时,接收到输入的语音信号为:“播放幻灯片1”,语音识别程序识别该语音信号后输出的控制信号可以为“打开幻灯片播放程序并播放幻灯片1”,则数字会议桌面控制幻灯片播放程序将幻灯片1播放在显示界面上。
当然,上述的例子仅仅是本公开的示例,本领域技术人员根据实际需要对任意终端发出任意语音信号执行控制终端的操作均是可以的,本公开对此无需加以限制。
本公开在终端处于预设状态时,自动启动麦克风,获取用户的语音信号,获取语音信号对应的控制信号,并根据控制信号执行操作,无需用户手动打开麦克风,使得用户可以在不触碰终端,或与终端有一定的物理距离的情况下,也能使用语音来控制终端的操作。
更进一步地,本公开可以通过将语音信号上传到云服务器,利用云服务器的强大的计算能力和存储空间,获得更准确和丰富的控制信号,当检测到网络连接失败时,还可以及时提醒用户启用网络。
实施例三
参照图3,示出了本公开的一种语音控制方法实施例三的示例性步骤流程图,本实施例的语音控制方法可以用于终端中,终端可以包括麦克风和语音识别程序,该方法可以由语音识别程序执行。
本实施例可以包括如下步骤。
在步骤301中,确定是否感应到语音信号,并确定所述终端是否处于预设状态。
在实际中,可以先确定是否感应到语音信号,再确定所述终端是否处于预设状态,也可以先确定所述终端是否处于预设状态,再确定是否感应到语音信号,本实施例对其执行的先后顺序无需加以限制。
在步骤302中,如果确定感应到语音信号且确定所述终端处于预设状态,打开所述终端的麦克风。
语音信号可以由集成在终端中的辅助配件声控装置感应,由于声控装置耗电极少,即使长时间开启声控装置也不会明显的消耗终端的电量,因此语音识别程序可以一直监听声控装置,在终端达到预设状态且声控装置感应到语音信号后才开启麦克风,可以减少麦克风开启的时间,进一步降低终端的电量消耗。
当然,本领域技术人员可以根据实际需要在终端中添加其他的辅助配件以达到省电的效果,本实施例对此无需加以限制。
步骤303,执行来自所述麦克风的语音信号所指示的操作。
在本实施例的一种实施方式中,可以本地识别输入的语音信号并执行语音信号所指示的操作,所述步骤303可以包括以下子步骤:
子步骤S51,识别来自所述麦克风的语音信号,并根据识别结果生成控制信号;
子步骤S52,根据所述控制信号执行操作。
在本实施例的另一种实施方式中,可以联网识别输入的语音信号并执行语音信号所指示的操作,所述步骤303可以包括以下子步骤:
子步骤S61,连接互联网;
子步骤S62,将来自所述麦克风的语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
子步骤S63,根据所述识别结果生成控制信号;
子步骤S64,根据所述控制信号执行操作。
当联网识别输入的语音信号时,本实施例还可以包括:
当所述连接互联网失败时,输出语音提示。
本实施例在声控装置感应到语音信号输入且终端处于预设状态时,才自动启动麦克风进行语音控制,由于声控装置耗电极少,在开启的声控装置感应到语音信号后再开启麦克风,可以进一步降低终端的耗电量。
实施例四
参照图4,示出了本公开提供的一种语音控制装置的示例性结构框图,所述语音控制装置用于终端中,所述装置可以包括如下单元。
麦克风开启单元401,用于在所述终端处于预设状态时,打开所述终端的麦克风。
在本实施例中,终端处于预设状态可以至少包括以下三种状态中的一种:
1、终端处于充电状态。
2、终端的当前位置参数为预设的位置阈值。
3、终端的当前显示时间为预设的时间阈值。
需要说明的是,上述预设状态可以由用户来配置和指定,并且可以配置多个条件的结合,例如1+2,或1+3等等。当然,本领域技术人员也可以根据实际需要配置和指定其他的环境参数为预设状态,本实施例对此不作限制。
在本实施例的一种实施方式中,所述麦克风开启单元401可以包括以下模块:
第一确定模块,用于确定是否感应到语音信号;
第二确定模块,用于确定所述终端是否处于预设状态;
麦克风打开模块,用于在感应到语音信号且确定所述终端处于预设状态时,打开所述终端的麦克风。
语音信号执行单元402,用于执行来自所述麦克风的语音信号所指示的操作。
在本实施例的一种实施方式中,所述语音信号执行单元402可以包括如下模块:
识别模块,用于识别来自所述麦克风的语音信号;
执行模块,用于根据所述识别结果生成控制信号,并根据所述控制信号执行操作。
在本实施例的另一种实施方式中,所述语音信号执行单元402可以包括如下模块:
连接模块,用于连接互联网;
识别模块,用于将所述语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
在本实施例的一种实施方式中,所述识别模块还用于在所述连接模块连接互联网失败时,输出语音提示。
执行模块,用于根据所述识别结果生成控制信号,并根据所述控制信号执行操作。
对于装置实施例而言,由于其与上述方法实施例基本相似,所以描述的比较简单,相关之处参照语音控制方法实施例的部分说明即可。
实施例五
参照图5是本公开提供的一种终端设备的示例性结构示意图。参见图5,该终端设备可以用于实施上述实施例中提供的智能终端的语音控制方法。其中,该终端设备可以为手机、平板电脑pad、穿戴式移动设备(如智能手表)等。
终端设备700可以包括通信单元110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、WiFi(wirelessfidelity,无线保真)模块170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图5中示出的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
通信单元110可用于收发信息或通话过程中,信号的接收和发送,该通信单元110可以为RF(Radio Frequency,射频)电路、路由器、调制解调器、等网络通信设备。特别地,当通信单元110为RF电路时,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,作为通信单元的RF电路包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,通信单元110还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(GeneralPacket Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、LTE(LongTerm Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端设备700的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。可选地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。可选地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端设备700的各种图形用户接口,这些图形用户接口可以由图形、文本、源显示框、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid CrystalDisplay,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图5中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
终端设备700还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。可选地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端设备700移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端设备700还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与终端设备700之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端设备,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端设备700的通信。
为了实现无线通信,该终端设备上可以配置有无线通信单元170,该无线通信单元170可以为WiFi模块。WiFi属于短距离无线传输技术,终端设备700通过无线通信单元170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图5示出了无线通信单元170,但是可以理解的是,其并不属于终端设备700的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是终端设备700的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端设备700的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
终端设备700还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
本实施例中的终端设备可以包括一个或多个处理器180,存储器120中可以存储一个或多个模块,所述一个或多个模块被配置成由所述一个或多个处理器180执行,其中,所述一个或多个模块具有如下功能:
当所述设备处于预设状态时,打开所述设备的麦克风;
执行来自所述麦克风的语音信号所指示的操作。
可选地,所述设备处于预设状态包括:所述设备处于充电状态,和/或,所述设备的当前位置参数为预设的位置阈值,和/或,所述设备的当前显示时间为预设的时间阈值。
可选地,所述当所述设备处于预设状态时,打开所述设备的麦克风的步骤包括:
确定是否感应到语音信号,并确定所述设备是否处于预设状态;
如果确定感应到语音信号且确定所述设备处于预设状态,打开所述设备的麦克风。
可选地,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
识别来自所述麦克风的语音信号,并根据识别结果生成控制信号;
根据所述控制信号执行操作。
可选地,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
连接互联网;
将来自所述麦克风的语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
根据所述识别结果生成控制信号;
根据所述控制信号执行操作。
可选地,所述一个或多个模块还具有如下功能:
当所述连接互联网失败时,输出语音提示。
实施例六
本公开还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备中时,可以使得该设备执行如下步骤的指令(instructions):
当所述设备处于预设状态时,打开所述设备的麦克风;
执行来自所述麦克风的语音信号所指示的操作。
可选地,所述设备处于预设状态包括:所述设备处于充电状态,和/或,所述设备的当前位置参数为预设的位置阈值,和/或,所述设备的当前显示时间为预设的时间阈值。
可选地,所述当所述设备处于预设状态时,打开所述设备的麦克风的步骤包括:
确定是否感应到语音信号,并确定所述设备是否处于预设状态;
如果确定感应到语音信号且确定所述设备处于预设状态,打开所述设备的麦克风。
可选地,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
识别来自所述麦克风的语音信号,并根据识别结果生成控制信号;
根据所述控制信号执行操作。
可选地,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
连接互联网;
将来自所述麦克风的语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
根据所述识别结果生成控制信号;
根据所述控制信号执行操作。
可选地,该一个或多个模块被应用在设备中时,还可以使得该设备执行如下步骤的指令(instructions):
当所述连接互联网失败时,输出语音提示。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参照即可。
本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开的方法、移动设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理移动设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理移动设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理移动设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理移动设备上,使得在计算机或其他可编程移动设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程移动设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本公开的实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者移动设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者移动设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者移动设备中还存在另外的相同要素。
以上对本公开所提供的一种语音控制方法、装置和设备进行了详细介绍,本文中应用了具体个例对本公开的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本公开的方法及其核心思想;同时,对于本领域的一般技术人员,依据本公开的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本公开的限制。

Claims (11)

1.一种语音控制方法,用于终端中,其特征在于,所述方法包括:
当所述终端处于预设状态时,打开所述终端的麦克风;所述终端处于预设状态包括:所述终端处于充电状态;
执行来自所述麦克风的语音信号所指示的操作;
其中,所述当所述终端处于预设状态时,打开所述终端的麦克风的步骤包括:
确定是否感应到语音信号,并确定所述终端是否处于预设状态;
如果确定感应到语音信号且确定所述终端处于预设状态,打开所述终端的麦克风。
2.根据权利要求1所述的方法,其特征在于,所述终端处于预设状态还包括:所述终端的当前位置参数为预设的位置阈值,和/或,所述终端的当前显示时间为预设的时间阈值。
3.根据权利要求1所述的方法,其特征在于,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
识别来自所述麦克风的语音信号,并根据识别结果生成控制信号;
根据所述控制信号执行操作。
4.根据权利要求1所述的方法,其特征在于,所述执行来自所述麦克风的语音信号所指示的操作的步骤包括:
连接互联网;
将来自所述麦克风的语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
根据所述识别结果生成控制信号;
根据所述控制信号执行操作。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当所述连接互联网失败时,输出语音提示。
6.一种语音控制装置,用于终端中,其特征在于,所述装置包括:
麦克风开启单元,用于在所述终端处于预设状态时,打开所述终端的麦克风;所述终端处于预设状态包括:所述终端处于充电状态;
语音信号执行单元,用于执行来自所述麦克风的语音信号所指示的操作;
其中,所述麦克风开启单元包括:
第一确定模块,用于确定是否感应到语音信号;
第二确定模块,用于确定所述终端是否处于预设状态;
麦克风打开模块,用于在感应到语音信号且确定所述终端处于预设状态时,打开所述终端的麦克风。
7.根据权利要求6所述的装置,其特征在于,所述终端处于预设状态还包括:所述终端的当前位置参数为预设的位置阈值,和/或,所述终端的当前显示时间为预设的时间阈值。
8.根据权利要求6所述的装置,其特征在于,所述语音信号执行单元,包括:
识别模块,用于识别来自所述麦克风的语音信号;
执行模块,用于根据所述识别结果生成控制信号,并根据所述控制信号执行操作。
9.根据权利要求6所述的装置,其特征在于,所述语音信号执行单元包括:
连接模块,用于连接互联网;
识别模块,用于将所述语音信号上传至云服务器中,所述云服务器用于识别所述语音信号,并返回识别结果;
执行模块,用于根据所述识别结果生成控制信号,并根据所述控制信号执行操作。
10.根据权利要求9所述的装置,其特征在于,所述识别模块还用于在所述连接模块连接互联网失败时,输出语音提示。
11.一种语音控制设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器;和
一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
当所述设备处于预设状态时,打开所述设备的麦克风;所述设备处于预设状态包括:所述设备处于充电状态;
执行来自所述麦克风的语音信号所指示的操作;
确定是否感应到语音信号,并确定所述设备是否处于预设状态;
如果确定感应到语音信号且确定所述设备处于预设状态,打开所述设备的麦克风。
CN201310512905.2A 2013-10-25 2013-10-25 一种语音控制方法、装置和设备 Active CN103578474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310512905.2A CN103578474B (zh) 2013-10-25 2013-10-25 一种语音控制方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310512905.2A CN103578474B (zh) 2013-10-25 2013-10-25 一种语音控制方法、装置和设备

Publications (2)

Publication Number Publication Date
CN103578474A CN103578474A (zh) 2014-02-12
CN103578474B true CN103578474B (zh) 2017-09-12

Family

ID=50050127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310512905.2A Active CN103578474B (zh) 2013-10-25 2013-10-25 一种语音控制方法、装置和设备

Country Status (1)

Country Link
CN (1) CN103578474B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905638B (zh) * 2014-03-10 2016-10-05 联想(北京)有限公司 一种信息处理方法及电子设备
JP6137039B2 (ja) * 2014-04-25 2017-05-31 Smk株式会社 リモートコントロールシステム及びリモートコントローラ
CN104657105B (zh) * 2015-01-30 2016-10-26 腾讯科技(深圳)有限公司 一种开启终端的语音输入功能的方法和装置
US20160232897A1 (en) * 2015-02-06 2016-08-11 Microsoft Technology Licensing, Llc Adapting timeout values based on input scopes
CN105185380B (zh) * 2015-06-24 2020-06-23 联想(北京)有限公司 一种信息处理方法及电子设备
CN105161100B (zh) * 2015-08-24 2019-12-24 联想(北京)有限公司 控制方法及电子设备
CN105223851A (zh) * 2015-10-09 2016-01-06 韩山师范学院 基于方言识别的智能插座系统及控制方法
US10880833B2 (en) * 2016-04-25 2020-12-29 Sensory, Incorporated Smart listening modes supporting quasi always-on listening
CN105807665A (zh) * 2016-04-26 2016-07-27 镇江艾迪智能科技有限公司 智能语音识别面板
CN106102134A (zh) * 2016-06-16 2016-11-09 捷开通讯(深圳)有限公司 一种移动终端及其录音方法
CN106326399A (zh) * 2016-08-22 2017-01-11 我骑我行(武汉)科技有限公司 一种基于互联网的数据交互系统
CN106338923A (zh) * 2016-09-14 2017-01-18 上海百芝龙网络科技有限公司 一种智能家居控制系统
CN106775570B (zh) * 2017-02-21 2021-05-18 联想(北京)有限公司 音频设备、包括所述音频设备的音频采集播放系统和方法
CN108573597A (zh) * 2017-03-08 2018-09-25 捷音特科技股份有限公司 声控无线系统及其穿戴式语音收发装置
KR102406718B1 (ko) * 2017-07-19 2022-06-10 삼성전자주식회사 컨텍스트 정보에 기반하여 음성 입력을 수신하는 지속 기간을 결정하는 전자 장치 및 시스템
KR102413282B1 (ko) * 2017-08-14 2022-06-27 삼성전자주식회사 개인화된 음성 인식 방법 및 이를 수행하는 사용자 단말 및 서버
US10250996B1 (en) * 2017-11-06 2019-04-02 Nuvoton Technology Corporation Method and apparatus of a switched microphone interface circuit for voice energy detection
CN108122554B (zh) * 2017-12-25 2021-12-21 广东小天才科技有限公司 一种在充电状态下麦克风设备的控制方法及麦克风设备
CN108111696A (zh) * 2017-12-29 2018-06-01 深圳市酷达通讯有限公司 一种无线座机
CN108831448B (zh) * 2018-03-22 2021-03-02 北京小米移动软件有限公司 语音控制智能设备的方法、装置及存储介质
CN108810280B (zh) * 2018-06-19 2021-01-08 Oppo广东移动通信有限公司 语音采集频率的处理方法、装置、存储介质及电子设备
CN108848264A (zh) * 2018-06-19 2018-11-20 Oppo广东移动通信有限公司 麦克风的控制方法、装置、存储介质及电子设备
CN110136707B (zh) * 2019-04-22 2021-03-02 云知声智能科技股份有限公司 一种用于进行多设备自主决策的人机交互系统
CN110691016B (zh) * 2019-09-29 2021-08-31 歌尔股份有限公司 一种基于音频设备实现的交互方法及音频设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN103282957A (zh) * 2010-08-06 2013-09-04 谷歌公司 基于上下文自动监测话音输入
CN103280217A (zh) * 2013-05-02 2013-09-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101612788B1 (ko) * 2009-11-05 2016-04-18 엘지전자 주식회사 이동 단말기 및 그 제어 방법
CN110164437B (zh) * 2012-03-02 2021-04-16 腾讯科技(深圳)有限公司 一种即时通信的语音识别方法和终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103282957A (zh) * 2010-08-06 2013-09-04 谷歌公司 基于上下文自动监测话音输入
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN103280217A (zh) * 2013-05-02 2013-09-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置

Also Published As

Publication number Publication date
CN103578474A (zh) 2014-02-12

Similar Documents

Publication Publication Date Title
CN103578474B (zh) 一种语音控制方法、装置和设备
CN103632165B (zh) 一种图像处理的方法、装置及终端设备
CN104123937B (zh) 提醒设置方法、装置和系统
CN108364644A (zh) 一种语音交互方法、终端及计算机可读介质
CN108735209A (zh) 唤醒词绑定方法、智能设备及存储介质
CN106847298A (zh) 一种基于弥漫式语音交互的拾音方法和装置
CN110197662A (zh) 语音控制方法、可穿戴设备及计算机可读存储介质
CN104581221A (zh) 视频直播的方法和装置
CN110096580A (zh) 一种faq对话方法、装置及电子设备
CN107402964A (zh) 一种信息推荐方法、服务器及终端
CN110166828A (zh) 一种视频处理方法和装置
CN103559731B (zh) 一种锁屏状态下歌词显示的方法及终端
CN107818786A (zh) 一种通话语音处理方法、移动终端
CN107633051A (zh) 桌面搜索方法、移动终端及计算机可读存储介质
CN108712566A (zh) 一种语音助手唤醒方法及移动终端
CN104239343A (zh) 一种用户输入信息的处理方法和装置
CN107798107A (zh) 歌曲推荐的方法和移动设备
CN111159338A (zh) 一种恶意文本的检测方法、装置、电子设备及存储介质
CN107862059A (zh) 一种歌曲推荐方法及移动终端
CN108093130A (zh) 一种查找联系人的方法及移动终端
CN106973168A (zh) 语音播放方法、装置及计算机设备
CN109726303A (zh) 一种图像推荐方法和终端
CN103593390B (zh) 一种多媒体信息识别的方法、装置及设备
CN106486119B (zh) 一种识别语音信息的方法和装置
CN104837036B (zh) 生成视频看点的方法、服务器、终端及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant