CN104658535A - 语音控制方法及装置 - Google Patents

语音控制方法及装置 Download PDF

Info

Publication number
CN104658535A
CN104658535A CN201510088881.1A CN201510088881A CN104658535A CN 104658535 A CN104658535 A CN 104658535A CN 201510088881 A CN201510088881 A CN 201510088881A CN 104658535 A CN104658535 A CN 104658535A
Authority
CN
China
Prior art keywords
voice signal
phonetic
voice
control command
mobile terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510088881.1A
Other languages
English (en)
Inventor
胡泰东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen ZTE Mobile Telecom Co Ltd
Original Assignee
Shenzhen ZTE Mobile Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen ZTE Mobile Telecom Co Ltd filed Critical Shenzhen ZTE Mobile Telecom Co Ltd
Priority to CN201510088881.1A priority Critical patent/CN104658535A/zh
Publication of CN104658535A publication Critical patent/CN104658535A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种语音控制方法,所述语音控制方法包括以下步骤:在播报第一语音信号的过程中,确定是否接收到语音控制指令;在接收到语音控制指令时,响应所述语音控制指令。本发明还公开了一种语音控制装置。本发明实现了在播报语音的同时还能够接收语音控制指令,以能够快速地响应语音控制指令,进而节约用户的时间。

Description

语音控制方法及装置
技术领域
本发明涉及语音技术领域,尤其涉及一种语音控制方法及装置。
背景技术
目前,移动终端通常具备语音播报功能,以便于用户根据移动终端播报的语音进行相应的操作,例如,在移动终端播报语音结束后,移动终端可以接收来自用户的语音指令,并根据接收的语音指令执行相应的操作。现有技术的缺陷在于,移动终端在播报语音的同时,不能接收来自用户的语音指令,用户必须等待移动终端播报语音结束后,才能对移动终端输入语音指令,从而造成时间的浪费。
发明内容
本发明的主要目的在于提供一种语音控制方法及装置,旨在实现移动终端在播报语音的同时能够接收语音指令,进而节约用户的时间。
本发明提供的语音控制方法包括以下步骤:
在播报第一语音信号的过程中,确定是否接收到语音控制指令;
在接收到语音控制指令时,响应所述语音控制指令。
优选地,所述在播报第一语音信号的过程中,确定是否接收到语音控制指令的步骤包括:
在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号;
确定所述第三语音信号是否为语音控制指令。
优选地,确定所述第三语音信号是否为语音控制指令的步骤包括:
将所述第三语音信号转换为文本信息;
将所述文本信息与预设的关键词进行比对,以确定所述第三语音信号是否为语音控制指令,其中,在所述文本信息与预设的关键词匹配时,所述第三语音信号为语音控制指令。
优选地,所述在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号的步骤之前,所述语音控制方法还包括:
在语音控制模式开启后,实时侦测第二语音信号。
优选地,所述在语音控制模式开启后,实时侦测第二语音信号的步骤之前,所述语音控制方法还包括:
在侦测到语音控制模式开启指令时,开启语音控制模式。
此外,本发明提供的语音控制装置包括:
确定模块,用于在播报第一语音信号的过程中,确定是否接收到语音控制指令;
响应模块,用于在接收到语音控制指令时,响应所述语音控制指令。
优选地,所述确定模块包括:
滤除单元,用于在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号;
确定单元,用于确定所述第三语音信号是否为语音控制指令。
优选地,所述确定单元包括:
转换子单元,用于将所述第三语音信号转换为文本信息;
确定子单元,用于将所述文本信息与预设的关键词进行比对,以确定所述第三语音信号是否为语音控制指令,其中,在文本信息与预设的关键词匹配时,所述第三语音信号为语音控制指令。
优选地,所述语音控制装置还包括:
侦测模块,用于在语音控制模式开启后,实时侦测第二语音信号。
优选地,所述语音控制装置还包括:
开启模块,用于在侦测到语音控制模式开启指令时,开启语音控制模式。
本发明提供的语音控制方法及装置,在播报第一语音信号的过程中,确定是否接收到语音控制指令,并在接收到语音控制指令时,响应所述语音控制指令,从而实现了在播报语音的同时还能够接收语音控制指令,以能够快速地响应语音控制指令,进而节约用户的时间。
附图说明
图1为实现本发明各个实施例的移动终端的硬件结构示意;
图2为如图1所示的移动终端的无线通信系统示意图;
图3为本发明语音控制方法第一实施例的流程示意图;
图4为本发明语音控制方法的确定是否接收到语音控制指令步骤的细化流程示意图;
图5为本发明语音控制方法的确定所述第三语音信号是否为语音控制指令步骤的细化流程示意图;
图6为本发明语音控制方法第二实施例的流程示意图;
图7为本发明语音控制方法第三实施例的流程示意图;
图8为本发明语音控制装置第一实施例的功能模块示意图;
图9为本发明语音控制装置的确定模块的细化功能模块示意图;
图10为本发明语音控制装置的确定单元的细化功能模块示意图;
图11为本发明语音控制装置第二实施例的流程示意图;
图12为本发明语音控制装置第三实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
图1为实现本发明各个实施例的移动终端的硬件结构示意。
移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。
广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。
移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。
无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波互联接入)、HSDPA(高速下行链路分组接入)等等。
短程通信模块114是用于支持短程通信的模块。短程通信技术的一些示例包括蓝牙TM、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂TM等等。
位置信息模块115是用于检查或获取移动终端的位置信息的模块。位置信息模块的典型示例是GPS(全球定位系统)。根据当前的技术,GPS模块115计算来自三个或更多卫星的距离信息和准确的时间信息并且对于计算的信息应用三角测量法,从而根据经度、纬度和高度准确地计算三维当前位置信息。当前,用于计算位置和时间信息的方法使用三颗卫星并且通过使用另外的一颗卫星校正计算出的位置和时间信息的误差。此外,GPS模块115能够通过实时地连续计算当前位置信息来计算速度信息。
A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机121和麦克风1220,相机121对在视频捕获模式或图像捕获模式中由图像捕获装置获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元151上。经相机121处理后的图像帧可以存储在存储器160(或其它存储介质)中或者经由无线通信单元110进行发送,可以根据移动终端的构造提供两个或更多相机1210。麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由移动通信模块112发送到移动通信基站的格式输出。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示单元151上时,可以形成触摸屏。
感测单元140检测移动终端100的当前状态,(例如,移动终端100的打开或关闭状态)、移动终端100的位置、用户对于移动终端100的接触(即,触摸输入)的有无、移动终端100的取向、移动终端100的加速或减速移动和方向等等,并且生成用于控制移动终端100的操作的命令或信号。例如,当移动终端100实施为滑动型移动电话时,感测单元140可以感测该滑动型电话是打开还是关闭。另外,感测单元140能够检测电源单元190是否提供电力或者接口单元170是否与外部装置耦接。感测单元140可以包括接近传感器1410将在下面结合触摸屏来对此进行描述。
接口单元170用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。识别模块可以是存储用于验证用户使用移动终端100的各种信息并且可以包括用户识别模块(UIM)、客户识别模块(SIM)、通用客户识别模块(USIM)等等。另外,具有识别模块的装置(下面称为"识别装置")可以采取智能卡的形式,因此,识别装置可以经由端口或其它连接装置与移动终端100连接。接口单元170可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端和外部装置之间传输数据。
另外,当移动终端100与外部底座连接时,接口单元170可以用作允许通过其将电力从底座提供到移动终端100的路径或者可以用作允许从底座输入的各种命令信号通过其传输到移动终端的路径。从底座输入的各种命令信号或电力可以用作用于识别移动终端是否准确地安装在底座上的信号。输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。输出单元150可以包括显示单元151、音频输出模块152、警报单元153等等。
显示单元151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示单元151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。
同时,当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示单元(或其它显示装置),例如,移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。
警报单元153可以提供输出以将事件的发生通知给移动终端100。典型的事件可以包括呼叫接收、消息接收、键信号输入、触摸输入等等。除了音频或视频输出之外,警报单元153可以以不同的方式提供输出以通知事件的发生。例如,警报单元153可以以振动的形式提供输出,当接收到呼叫、消息或一些其它进入通信(incoming communication)时,警报单元153可以提供触觉输出(即,振动)以将其通知给用户。通过提供这样的触觉输出,即使在用户的移动电话处于用户的口袋中时,用户也能够识别出各种事件的发生。警报单元153也可以经由显示单元151或音频输出模块152提供通知事件的发生的输出。
存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。
存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。
控制器180通常控制移动终端的总体操作。例如,控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外,控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块1810,多媒体模块1810可以构造在控制器180内,或者可以构造为与控制器180分离。控制器180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。
电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。
这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器180中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器180执行。
至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。
如图1中所示的移动终端100可以被构造为利用经由帧或分组发送数据的诸如有线和无线通信系统以及基于卫星的通信系统来操作。
现在将参考图2描述其中根据本发明的移动终端能够操作的通信系统。
这样的通信系统可以使用不同的空中接口和/或物理层。例如,由通信系统使用的空中接口包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动通信系统(UMTS)(特别地,长期演进(LTE))、全球移动通信系统(GSM)等等。作为非限制性示例,下面的描述涉及CDMA通信系统,但是这样的教导同样适用于其它类型的系统。
参考图2,CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275和移动交换中心(MSC)280。MSC280被构造为与公共电话交换网络(PSTN)290形成接口。MSC280还被构造为与可以经由回程线路耦接到基站270的BSC275形成接口。回程线路可以根据若干己知的接口中的任一种来构造,所述接口包括例如E1/T1、ATM,IP、PPP、帧中继、HDSL、ADSL或xDSL。将理解的是,如图2中所示的系统可以包括多个BSC2750。
每个BS270可以服务一个或多个分区(或区域),由多向天线或指向特定方向的天线覆盖的每个分区放射状地远离BS270。或者,每个分区可以由用于分集接收的两个或更多天线覆盖。每个BS270可以被构造为支持多个频率分配,并且每个频率分配具有特定频谱(例如,1.25MHz,5MHz等等)。
分区与频率分配的交叉可以被称为CDMA信道。BS270也可以被称为基站收发器子系统(BTS)或者其它等效术语。在这样的情况下,术语"基站"可以用于笼统地表示单个BSC275和至少一个BS270。基站也可以被称为"蜂窝站"。或者,特定BS270的各分区可以被称为多个蜂窝站。
如图2中所示,广播发射器(BT)295将广播信号发送给在系统内操作的移动终端100。如图1中所示的广播接收模块111被设置在移动终端100处以接收由BT295发送的广播信号。在图2中,示出了几个全球定位系统(GPS)卫星300。卫星300帮助定位多个移动终端100中的至少一个。
在图2中,描绘了多个卫星300,但是理解的是,可以利用任何数目的卫星获得有用的定位信息。如图1中所示的GPS模块115通常被构造为与卫星300配合以获得想要的定位信息。替代GPS跟踪技术或者在GPS跟踪技术之外,可以使用可以跟踪移动终端的位置的其它技术。另外,至少一个GPS卫星300可以选择性地或者额外地处理卫星DMB传输。
作为无线通信系统的一个典型操作,BS270接收来自各种移动终端100的反向链路信号。移动终端100通常参与通话、消息收发和其它类型的通信。特定基站270接收的每个反向链路信号被在特定BS270内进行处理。获得的数据被转发给相关的BSC275。BSC提供通话资源分配和包括BS270之间的软切换过程的协调的移动管理功能。BSC275还将接收到的数据路由到MSC280,其提供用于与PSTN290形成接口的额外的路由服务。类似地,PSTN290与MSC280形成接口,MSC与BSC275形成接口,并且BSC275相应地控制BS270以将正向链路信号发送到移动终端100。
基于上述移动终端硬件结构以及通信系统,本发明提供一种语音控制方法,在以下语音控制方法的各个实施例中,均以上述移动终端100作为执行主体为例进行描述。
参照图3,图3为本发明语音控制方法第一实施例的流程示意图,本发明提出的语音控制方法包括以下步骤:
步骤S10,在播报第一语音信号的过程中,确定是否接收到语音控制指令;
在本实施例中,第一语音信号即为移动终端播报的语音信号,例如,第一语音信号可以为移动终端播报的用于供用户选择的选择信号,在移动终端播报第一语音信号的过程中,移动终端确定是否接收到语音控制指令。上述语音控制指令优选为用户基于移动终端播报的选择信号发出的声音信号。
在移动终端插接耳机时,若移动终端当前接收到声音信号,即可视为移动终端接收到了语音控制指令。例如,移动终端当前插接有耳机,移动终端播报的第一语音信号通过耳机输出至用户,并通过话筒接收用户发出的声音信号,因此移动终端播报的第一语音信号与用户发出的语音信号不会混淆,从而在移动终端接收到声音信号时,即可视为接收到了语音控制指令。
在移动终端未插接耳机时,此时,在移动终端播报第一语音信号的同时,第一语音信号还会被移动终端的话筒接收,在用户发出声音信号时,第一语音信号将会与用户发出的声音信号混淆,基于此,为了提高确定语音控制指令的准确性,参照图4,图4为本发明语音控制方法的确定是否接收到语音控制指令步骤的细化流程示意图,步骤S10包括:
步骤S11,在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号;
在本实施例中,上述第二语音信号即为移动终端接收的声音信号,该声音信号可能包括用户发出的声音信号、环境噪音和移动终端播报的第一语音信号。上述第三语音信号可能为环境噪音,或者为用户发出的声音信号和环境噪音的叠加。
步骤S12,确定所述第三语音信号是否为语音控制指令。
在本实施例中,可通过多种方式确定所述第三语音信号是否为语音控制指令,例如:
1)可以通过第三语音信号的频率来判断第三语音信号是否为用户发出的声音信号。例如,人的发音频率大约在85HZ至1100HZ,若第三语音信号的频率在85HZ至1100HZ的范围之内,则确定第三语音信号为语音控制指令;若第三语音信号的频率在85HZ至1100HZ的范围之外,则确定第三语音信号不为语音控制指令。
2)还可以通过语义理解的方式来判断第三语音信号是否为语音控制指令。此时,参照图5,图5为本发明语音控制方法的确定所述第三语音信号是否为语音控制指令步骤的细化流程示意图,步骤S12包括:
步骤S121,将所述第三语音信号转换为文本信息;
在本实施例中,可以通过现有的语音转换文字软件将第三语音信号转换为文本信息,在此不作限定。
步骤S122,将所述文本信息与预设的关键词进行比对,以确定所述第三语音信号是否为语音控制指令,其中,在所述文本信息与预设的关键词匹配时,所述第三语音信号为语音控制指令。
在本实施例中,预设有关键词库,关键词库中预存有若干关键词,每一关键词对应一实体操作响应,若所述文本信息能够与关键词库中的关键词匹配,则认为第三语音信号为语音控制指令;若所述文本信息不能与关键词库中的关键词匹配,则认为第三语音信息不为语音控制指令,则继续执行步骤S10。
以上所列举出的确定所述第三语音信号是否为语音控制指令的实施例仅仅为示例性的,本领域技术人员利用本发明的技术思想,根据其具体需求所提出的其他确定所述第三语音信号是否为语音控制指令的实施例均在本发明的保护范围内,在此不进行一一穷举。
优选地,在确定没有接收到语音控制指令时,则继续执行步骤S10。在确定接收到语音控制指令时,则继续执行步骤S20。
步骤S20,在接收到语音控制指令时,响应所述语音控制指令。
在本实施例中,移动终端在确定接收到语音控制指令后,将执行与该语音控制指令相应的操作,即响应与上述根据文本信息匹配的关键词所对应的实体操作。
例如,若移动终端存储的联系人A具有多个电话号码,包括手机号码、办公电话号码和住宅电话号码等,在用户向移动终端发出给联系人A打电话的指令时,移动终端可以播报如下第一语音信号:“请选择联系人A的电话号码,手机号码、办公电话号码、住宅电话号码。”,若用户想给联系人A的手机号码打电话,则在移动终端还未播报结束时,用户即可对移动终端报出“手机号码”声音信号,移动终端接收的“手机号码”语音信号即可视为上述语音控制指令,移动终端将自动拨打联系人A的手机号码,即移动终端响应了语音控制指令。
本发明提供的语音控制方法,在播报第一语音信号的过程中,确定是否接收到语音控制指令,并在接收到语音控制指令时,响应所述语音控制指令,从而实现了在播报语音的同时还能够接收语音控制指令,以能够快速地响应语音控制指令,进而节约用户的时间。
进一步的,基于语音控制方法的第一实施例,本发明还提出了语音控制方法的第二实施例,参照图6,图6为本发明语音控制方法第二实施例的流程示意图,步骤S11之前,所述语音控制方法还包括以下步骤:
步骤S30,在语音控制模式开启后,实时侦测第二语音信号。
在本实施例中,在移动终端每次开启语音控制模式后,通过实时侦测第二语音信号,从而保证了只要用户发出语音控制指令,移动终端便能实时的响应所述语音控制指令,进一步节约了用户的时间。
进一步的,基于语音控制方法的第二实施例,本发明还提出了语音控制方法的第三实施例,参照图7,图7为本发明语音控制方法第三实施例的流程示意图,步骤S30之前,所述语音控制方法还包括:
步骤S40,在侦测到语音控制模式开启指令时,开启语音控制模式。
在本实施例中,在移动终端的设置界面可以预设一语音控制模式开启控件,在用户触发该语音控制模式开启控件时,即可视为侦测到了语音控制模式开启指令;或者,在移动终端上设置一语音控制模式开启按键,在用户按压该语音控制模式开启按键时,即可视为移动终端侦测到了语音控制模式开启指令。
本发明进一步提供一种语音控制装置。
参照图8,图8为本发明语音控制装置第一实施例的功能模块示意图,本发明提供的语音控制装置包括:
确定模块10,用于在播报第一语音信号的过程中,确定是否接收到语音控制指令;
在本实施例中,第一语音信号即为移动终端播报的语音信号,例如,第一语音信号可以为移动终端播报的用于供用户选择的选择信号,在移动终端播报第一语音信号的过程中,确定模块10确定是否接收到语音控制指令。上述语音控制指令优选为用户基于移动终端播报的选择信号发出的声音信号。
在移动终端插接耳机时,若确定模块10当前接收到声音信号,即可视为确定模块10接收到了语音控制指令。例如,移动终端当前插接有耳机,移动终端播报的第一语音信号通过耳机输出至用户,并通过话筒接收用户发出的声音信号,因此移动终端播报的第一语音信号与用户发出的语音信号不会混淆,从而在确定模块10接收到声音信号时,即可视为接收到了语音控制指令。
在移动终端未插接耳机时,此时,在移动终端播报第一语音信号的同时,第一语音信号还会被移动终端的话筒接收,在用户发出声音信号时,第一语音信号将会与用户发出的声音信号混淆,基于此,为了提高确定语音控制指令的准确性,参照图9,图9为本发明语音控制装置的确定模块的细化功能模块示意图,确定模块10包括:
滤除单元11,用于在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号;
在本实施例中,上述第二语音信号即为移动终端接收的声音信号,该声音信号可能包括用户发出的声音信号、环境噪音和移动终端播报的第一语音信号。上述第三语音信号可能为环境噪音,或者为用户发出的声音信号和环境噪音的叠加。
确定单元12,用于确定所述第三语音信号是否为语音控制指令。
在本实施例中,确定单元12可通过多种方式确定所述第三语音信号是否为语音控制指令,例如:
1)确定单元12可以通过第三语音信号的频率来判断第三语音信号是否为用户发出的声音信号。例如,人的发音频率大约在85HZ至1100HZ,若第三语音信号的频率在85HZ至1100HZ的范围之内,则确定第三语音信号为语音控制指令;若第三语音信号的频率在85HZ至1100HZ的范围之外,则确定第三语音信号不为语音控制指令。
2)确定单元12还可以通过语义理解的方式来判断第三语音信号是否为语音控制指令。此时,参照图10,图10为本发明语音控制装置的确定单元的细化功能模块示意图,确定单元12包括:
转换子单元121,用于将所述第三语音信号转换为文本信息;
在本实施例中,转换子单元121可以通过现有的语音转换文字软件将第三语音信号转换为文本信息,在此不作限定。
确定子单元122,用于将所述文本信息与预设的关键词进行比对,以确定所述第三语音信号是否为语音控制指令,其中,在文本信息与预设的关键词匹配时,所述第三语音信号为语音控制指令。
在本实施例中,预设有关键词库,关键词库中预存有若干关键词,每一关键词对应一实体操作响应,若所述文本信息能够与关键词库中的关键词匹配,则确定子单元122认为第三语音信号为语音控制指令;若所述文本信息不能与关键词库中的关键词匹配,则确定子单元122认为第三语音信息不为语音控制指令,则确定模块10继续确定是否接收到语音控制指令。
以上所列举出的确定模块10的实施例仅仅为示例性的,本领域技术人员利用本发明的技术思想,根据其具体需求所提出的其他确定模块10的实施例均在本发明的保护范围内,在此不进行一一穷举。
响应模块20,用于在接收到语音控制指令时,响应所述语音控制指令。
在本实施例中,移动终端在确定接收到语音控制指令后,响应模块20将执行与该语音控制指令相应的操作,即响应与上述根据文本信息匹配的关键词所对应的实体操作。
例如,若移动终端存储的联系人A具有多个电话号码,包括手机号码、办公电话号码和住宅电话号码等,在用户向移动终端发出给联系人A打电话的指令时,移动终端可以播报如下第一语音信号:“请选择联系人A的电话号码,手机号码、办公电话号码、住宅电话号码。”,若用户想给联系人A的手机号码打电话,则在移动终端还未播报结束时,用户即可对移动终端报出“手机号码”声音信号,移动终端接收的“手机号码”语音信号即可视为上述语音控制指令,响应模块20将自动拨打联系人A的手机号码,即响应模块20响应了语音控制指令。
本发明提供的语音控制装置,在播报第一语音信号的过程中,确定是否接收到语音控制指令,并在接收到语音控制指令时,响应所述语音控制指令,从而实现了在播报语音的同时还能够接收语音控制指令,以能够快速地响应语音控制指令,进而节约用户的时间。
进一步的,基于语音控制装置的第一实施例,本发明还提出了语音控制装置的第二实施例,参照图11,图11为本发明语音控制装置第二实施例的流程示意图,所述语音控制装置还包括:
侦测模块30,用于在语音控制模式开启后,实时侦测第二语音信号。
在本实施例中,在移动终端每次开启语音控制模式后,通过侦测模块30实时侦测第二语音信号,从而保证了只要用户发出语音控制指令,响应模块20便能实时的响应所述语音控制指令,进一步节约了用户的时间。
进一步的,基于语音控制装置的第二实施例,本发明还提出了语音控制装置的第三实施例,参照图12,图12为本发明语音控制装置第三实施例的流程示意图,所述语音控制装置还包括:
开启模块40,用于在侦测到语音控制模式开启指令时,开启语音控制模式。
在本实施例中,开启模块40可以为在移动终端的设置界面预设的一语音控制模式开启控件,在用户触发该语音控制模式开启控件时,即可视为开启模块40侦测到了语音控制模式开启指令;或者,开启模块40还可以为在移动终端上设置的一语音控制模式开启按键,在用户按压该语音控制模式开启按键时,即可视为开启模块40侦测到了语音控制模式开启指令。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音控制方法,其特征在于,所述语音控制方法包括以下步骤:
在播报第一语音信号的过程中,确定是否接收到语音控制指令;
在接收到语音控制指令时,响应所述语音控制指令。
2.如权利要求1所述的语音控制方法,其特征在于,所述在播报第一语音信号的过程中,确定是否接收到语音控制指令的步骤包括:
在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号;
确定所述第三语音信号是否为语音控制指令。
3.如权利要求2所述的语音控制方法,其特征在于,确定所述第三语音信号是否为语音控制指令的步骤包括:
将所述第三语音信号转换为文本信息;
将所述文本信息与预设的关键词进行比对,以确定所述第三语音信号是否为语音控制指令,其中,在所述文本信息与预设的关键词匹配时,所述第三语音信号为语音控制指令。
4.如权利要求2或3所述的语音控制方法,其特征在于,所述在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号的步骤之前,所述语音控制方法还包括:
在语音控制模式开启后,实时侦测第二语音信号。
5.如权利要求4所述的语音控制方法,其特征在于,所述在语音控制模式开启后,实时侦测第二语音信号的步骤之前,所述语音控制方法还包括:
在侦测到语音控制模式开启指令时,开启语音控制模式。
6.一种语音控制装置,其特征在于,所述语音控制装置包括:
确定模块,用于在播报第一语音信号的过程中,确定是否接收到语音控制指令;
响应模块,用于在接收到语音控制指令时,响应所述语音控制指令。
7.如权利要求6所述的语音控制装置,其特征在于,所述确定模块包括:
滤除单元,用于在播报第一语音信号的过程中,且在接收到第二语音信号时,在所述第二语音信号中滤除所述第一语音信号,以生成第三语音信号;
确定单元,用于确定所述第三语音信号是否为语音控制指令。
8.如权利要求7所述的语音控制装置,其特征在于,所述确定单元包括:
转换子单元,用于将所述第三语音信号转换为文本信息;
确定子单元,用于将所述文本信息与预设的关键词进行比对,以确定所述第三语音信号是否为语音控制指令,其中,在所述文本信息与预设的关键词匹配时,所述第三语音信号为语音控制指令。
9.如权利要求7或8所述的语音控制装置,其特征在于,所述语音控制装置还包括:
侦测模块,用于在语音控制模式开启后,实时侦测第二语音信号。
10.如权利要求9所述的语音控制装置,其特征在于,所述语音控制装置还包括:
开启模块,用于在侦测到语音控制模式开启指令时,开启语音控制模式。
CN201510088881.1A 2015-02-26 2015-02-26 语音控制方法及装置 Pending CN104658535A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510088881.1A CN104658535A (zh) 2015-02-26 2015-02-26 语音控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510088881.1A CN104658535A (zh) 2015-02-26 2015-02-26 语音控制方法及装置

Publications (1)

Publication Number Publication Date
CN104658535A true CN104658535A (zh) 2015-05-27

Family

ID=53249575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510088881.1A Pending CN104658535A (zh) 2015-02-26 2015-02-26 语音控制方法及装置

Country Status (1)

Country Link
CN (1) CN104658535A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096551A (zh) * 2015-07-29 2015-11-25 努比亚技术有限公司 一种实现虚拟遥控器的装置和方法
CN105979394A (zh) * 2015-12-04 2016-09-28 乐视致新电子科技(天津)有限公司 智能电视的浏览器操作方法及智能电视
CN106098063A (zh) * 2016-07-01 2016-11-09 海信集团有限公司 一种语音控制方法、终端设备和服务器
CN106227498A (zh) * 2016-07-21 2016-12-14 乐视控股(北京)有限公司 一种语音控制的方法和装置
CN109346081A (zh) * 2018-12-20 2019-02-15 广州河东科技有限公司 一种语音控制方法、装置、设备和存储介质
CN110176233A (zh) * 2019-04-28 2019-08-27 青岛海尔空调器有限总公司 空调语音控制的方法、装置及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1194427A (zh) * 1997-03-26 1998-09-30 德国汤姆逊-布朗特公司 对设备进行语音操作遥控的方法和装置
CN102456352A (zh) * 2010-10-26 2012-05-16 深圳Tcl新技术有限公司 一种背景音频处理装置以及处理方法
US20120166190A1 (en) * 2010-12-23 2012-06-28 Electronics And Telecommunications Research Institute Apparatus for removing noise for sound/voice recognition and method thereof
CN102833633A (zh) * 2012-09-04 2012-12-19 深圳创维-Rgb电子有限公司 一种电视机语音控制系统及方法
CN102915732A (zh) * 2012-10-31 2013-02-06 黑龙江省电力有限公司信息通信分公司 抑制背景广播的语音指令识别方法与装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1194427A (zh) * 1997-03-26 1998-09-30 德国汤姆逊-布朗特公司 对设备进行语音操作遥控的方法和装置
CN102456352A (zh) * 2010-10-26 2012-05-16 深圳Tcl新技术有限公司 一种背景音频处理装置以及处理方法
US20120166190A1 (en) * 2010-12-23 2012-06-28 Electronics And Telecommunications Research Institute Apparatus for removing noise for sound/voice recognition and method thereof
CN102833633A (zh) * 2012-09-04 2012-12-19 深圳创维-Rgb电子有限公司 一种电视机语音控制系统及方法
CN102915732A (zh) * 2012-10-31 2013-02-06 黑龙江省电力有限公司信息通信分公司 抑制背景广播的语音指令识别方法与装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096551A (zh) * 2015-07-29 2015-11-25 努比亚技术有限公司 一种实现虚拟遥控器的装置和方法
CN105979394A (zh) * 2015-12-04 2016-09-28 乐视致新电子科技(天津)有限公司 智能电视的浏览器操作方法及智能电视
CN106098063A (zh) * 2016-07-01 2016-11-09 海信集团有限公司 一种语音控制方法、终端设备和服务器
CN106098063B (zh) * 2016-07-01 2020-05-22 海信集团有限公司 一种语音控制方法、终端设备和服务器
CN106227498A (zh) * 2016-07-21 2016-12-14 乐视控股(北京)有限公司 一种语音控制的方法和装置
CN109346081A (zh) * 2018-12-20 2019-02-15 广州河东科技有限公司 一种语音控制方法、装置、设备和存储介质
CN110176233A (zh) * 2019-04-28 2019-08-27 青岛海尔空调器有限总公司 空调语音控制的方法、装置及计算机存储介质

Similar Documents

Publication Publication Date Title
CN104850259A (zh) 组合操作方法和装置、触摸屏操作方法及电子设备
CN105187521A (zh) 业务处理装置及方法
CN104731512A (zh) 图片分享的方法、装置及终端
CN104915140A (zh) 基于虚拟按键触摸操作数据的处理方法及装置
CN104850443A (zh) 一种关闭误启动应用程序的方法以及移动终端
CN104731480A (zh) 基于触摸屏的图像显示方法及装置
CN105159700A (zh) 应用自启动控制装置及方法
CN104850799A (zh) 一种隐藏移动终端中的数据的方法及移动终端
CN104658535A (zh) 语音控制方法及装置
CN105045502A (zh) 一种图像处理方法及装置
CN104778067A (zh) 启动音效的方法及终端设备
CN105094612A (zh) 对象选择方法和装置
CN104731340A (zh) 光标位置确定方法及终端设备
CN104881223A (zh) 一种实现应用操作的方法及装置
CN104915111A (zh) 终端操作控制方法及装置
CN105245741A (zh) 通话转移方法及装置
CN104898940A (zh) 图片处理方法及装置
CN104915127A (zh) 一种触摸键设置方法和装置、以及移动终端
CN105357367A (zh) 基于压力传感器的按键识别装置及方法
CN104731456A (zh) 桌面小部件显示方法和装置
CN104951229A (zh) 屏幕截图方法和装置
CN105138871A (zh) 移动终端的解锁方法、装置及移动终端
CN104866352A (zh) 一种启动应用程序的方法及移动终端
CN105224647A (zh) 图片显示方法及装置
CN104731455A (zh) 应用标识显示方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518057 Guangdong province Shenzhen city Nanshan District high tech park, No. 9018 North Central Avenue, building A, floor six, Han's innovation

Applicant after: Nubian Technologies Ltd.

Address before: 518057 Guangdong province Shenzhen city Nanshan District high tech park, No. 9018 North Central Avenue, building A, floor six, Han's innovation

Applicant before: Shenzhen ZTE Mobile Tech Co., Ltd.

COR Change of bibliographic data
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150527