CN107358953A - 语音控制方法、移动终端及存储介质 - Google Patents

语音控制方法、移动终端及存储介质 Download PDF

Info

Publication number
CN107358953A
CN107358953A CN201710530612.5A CN201710530612A CN107358953A CN 107358953 A CN107358953 A CN 107358953A CN 201710530612 A CN201710530612 A CN 201710530612A CN 107358953 A CN107358953 A CN 107358953A
Authority
CN
China
Prior art keywords
control
mobile terminal
voice
operable
control information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710530612.5A
Other languages
English (en)
Inventor
魏强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201710530612.5A priority Critical patent/CN107358953A/zh
Publication of CN107358953A publication Critical patent/CN107358953A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种语音控制方法,该方法包括:检测移动终端显示界面中的可操作控件;生成与所述可操作控件一一对应的控制信息;检测并识别移动终端周围环境产生的语音,当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件。本发明还公开了一种移动终端,以及一种存储介质。本发明不需要用户预先在移动终端中保存与控制操作相关的语音,也不需要将保存的语音与移动终端中具体的控制操作进行绑定,便可实现利用语音控制移动终端,解决了现有技术中利用语音控制移动终端时,操作过程较为繁琐的技术问题。

Description

语音控制方法、移动终端及存储介质
技术领域
本发明涉及语音控制技术领域,尤其涉及一种语音控制方法、移动终端及存储介质。
背景技术
随着移动终端的智能化程度越来越高,移动终端内运行的程序也越来越多,用户主要通过触摸点击等操作方式来控制移动终端,当用户的双手被占用或者沾水时,则无法对移动终端进行操作,因此,利用语音来控制移动终端已成为移动终端一项重要的功能。
目前,移动终端的语音控制,需要先在移动终端中保存用于与控制操作相关的语音,比如需用户对准移动终端录入“开始”、“暂停”等控制语音,然后将录入的语音与移动终端中具体的控制操作进行绑定,然后移动终端检测周围环境中的语音,当检测到的语音与保存的语音所包含的信息相匹配时,则执行检测到的语音所绑定的控制操作。即上述语音控制方法,需要用户预先在移动终端中保存与控制操作相关的语音,然后再与移动终端中具体的控制操作进行绑定,操作过程较为繁琐。
发明内容
本发明的主要目的在于提出一种语音控制方法、移动终端及存储介质,旨在解决现有技术中利用语音控制移动终端时,需要用户预先在移动终端中保存与控制操作相关的语音,然后再与移动终端中具体的控制操作进行绑定,操作过程较为繁琐的技术问题。
为实现上述目的,本发明提供一种语音控制方法,所述语音控制方法包括:
检测移动终端显示界面中的可操作控件;
生成与所述可操作控件一一对应的控制信息;
检测并识别移动终端周围环境产生的语音,当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件。
可选的,所述生成与所述可操作控件一一对应的控制信息的步骤之后还包括:
将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示。
可选的,将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示的步骤之后还包括:
当检测到移动终端显示界面切换之后,则重新检测移动终端当前显示界面中的可操作控件,并重新生成与移动终端当前显示界面中的可操作控件一一对应的控制信息。
可选的,所述检测并识别移动终端周围环境产生的语音的步骤包括:
检测移动终端周围环境产生的语音,并利用预置的语音识别算法提取出所述语音中的语音特征值,根据所述语音特征值识别出所述语音中包含的关键字。
可选的,所述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
判断所述控制信息中是否存在任意控制信息与所述关键字相同;
当所述控制信息中存在任意控制信息与所述关键字相同时,则触发所述任意控制信息对应的可操作控件。
可选的,所述可操作控件包括所述移动终端显示界面中的可点击操作控件、可滑动操作控件、可长按操作控件,所述触发所述任意控制信息对应的可操作控件的步骤包括:
当所述可操作控件为可点击操作控件时,则控制所述移动终端执行所述可点击操作控件对应的点击操作;
当所述可操作控件为可滑动操作控件时,则控制所述移动终端执行所述可滑动操作控件对应的滑动操作;
当所述可操作控件为可长按操作控件时,则控制所述移动终端执行所述可长按操作控件对应的长按操作。
可选的,所述检测移动终端显示界面中的可操作控件的步骤之前还包括:
当接收到语音控制指令时,将所述移动终端切换为语音控制模式。
可选的,所述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
当所述语音中的关键字与任意控制信息相同时,判断所述移动终端当前是否处于语音控制模式;
若所述移动终端当前处于语音控制模式,则触发所述任意控制信息对应的可操作控件,若所述移动终端当前处于非语音控制模式,则保持所述任意控制信息对应的可操作控件当前的状态。
此外,为实现上述目的,本发明还提供一种移动终端,所述移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音控制程序,所述语音控制程序被所述处理器执行时实现如上所述的语音控制方法对应的各个步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有语音控制程序,所述语音控制程序被处理器执行时实现如上所述的语音控制方法对应的各个步骤。
本发明提供的语音控制方法、移动终端及存储介质,可实现:通过检测移动终端显示界面中的可操作控件,然后生成与该可操作控件一一对应的控制信息,并向用户进行展示,以使用户能够根据该控制信息来向移动终端发出语音控制指令;同时,检测并识别移动终端周围环境产生的语音,当检测到的语音中的关键字与任意控制信息相同时,则触发该任意控制信息对应的可操作控件。本发明不需要用户预先在移动终端中保存与控制操作相关的语音,也不需要将保存的语音与移动终端中具体的控制操作进行绑定,便可实现利用语音控制移动终端,解决了现有技术中利用语音控制移动终端时,操作过程较为繁琐的技术问题。
附图说明
图1为实现本发明各个实施例一个可选的移动终端的硬件结构示意图;
图2为本发明语音控制方法第一实施例的流程示意图;
图3为本发明中将生成的控制信息在移动终端显示界面进行显示的场景示意图;
图4为本发明中移动终端显示界面中的可滑动操作控件示意图;
图5为本发明语音控制方法第四实施例的流程示意图;
图6为本发明移动终端涉及的软件运行环境的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
基于上述移动终端硬件结构以及通信网络系统,提出本发明各个实施例。
本发明以下实施例提供一种语音控制方法,该方法通过检测移动终端显示界面中的可操作控件,然后根据检测到的可操作控件,生成与该可操作控件一一对应的控制信息,并向用户进行展示,以使用户根据该控制信息来向移动终端发出语音控制指令;同时,检测并识别移动终端周围环境产生的语音,当检测到的语音中的关键字与任意控制信息中的关键字相同时,则自动触发该任意控制信息对应的可操作控件,本方法不需要用户预先在移动终端中保存与控制操作相关的语音,也不需要将保存的语音与移动终端中具体的控制操作进行绑定,便可实现利用语音控制移动终端。
具体的,参照图2,图2为本发明语音控制方法第一实施例的流程示意图,在本发明语音控制方法第一实施例中,上述语音控制方法包括:
步骤S10,检测移动终端显示界面中的可操作控件。
其中,移动终端显示界面中的可操作控件是指移动终端显示界面中用户可操作的图标、菜单、功能等,例如移动终端当前运行预约播放应用时,移动终端显示界面的可操作控件可包括:“上一曲”、“下一曲”、“播放/暂停”、“收藏”、“下载”、“音量+/音量-”、“播放进度条”、“返回”等。
步骤S20,生成与所述可操作控件一一对应的控制信息。
本实施例在,在检测移动终端显示界面中的可操作控件之后,根据检测到的可操作控件,生成与各个可操作控件对应的控制信息,该控制信息可包括数字(如1、2、3……)、字母(如a、b、c……)、文字(如播放、暂停、返回……)等。
其中,上述可操作控件与所述控制信息为一一对应的关系,即每一个可操作控件都对应有一个独特的控制信息,例如可操作控件“上一曲”对应的控制信息为“1”,可操作控件“下一曲”对应的控制信息为“2”,可操作控件“播放/暂停”对应的控制信息为“3”等。
进一步地,上述步骤S20中所述的生成与所述可操作控件一一对应的控制信息之后还包括:
将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示。
本实施例中,在生成与所述可操作控件一一对应的控制信息之后,先将各个可操作控件与其对应的控制信息相互关联,然后将关联后的控制信息以标签、图标、悬浮窗等方式在移动终端显示界面进行显示,从而方便用户根据各个可操作控件对应的控制信息来控制移动终端。
为了更好的理解本发明,参照图3,图3为本发明中将生成的控制信息在移动终端显示界面进行显示的场景示意图,在图3中,以移动终端运行音乐播放器为例,假设此时移动终端显示界面中检测到的可操作控件有:“上一曲”、“播放/暂停”、“下一曲”、“播放进度条”,则生成与所述可操作控件一一对应的控制信息为“1”、“2”、“3”、“4”,其中,可操作控件“上一曲”对应关联的控制信息为“1”,“播放/暂停”对应关联的的控制信息为“2”,“下一曲”对应关联的控制信息为“3”,“播放进度条”对应关联的控制信息为“4”,然后将关联后的控制信息在移动终端显示界面进行显示。
步骤S30,检测并识别移动终端周围环境产生的语音,当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件。
其中,上述检测并识别移动终端周围环境产生的语音的步骤包括:
检测移动终端周围环境产生的语音,并利用预置的语音识别算法提取出所述语音中的语音特征值,根据所述语音特征值识别出所述语音中包含的关键字。
本实施例中,在生成与上述可操作控件一一对应的控制信息之后,检测移动终端周围环境产生的语音,然后利用语音识别技术识别检测到的语音中包含的关键词。
其中,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolatedword recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。
根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用,本实施例优先采用非特定人语音识别。
在语音识别前,需要预先建立语音数据库,该数据库中需保存各种关键字对应的语音特征值,在语音识别过程中,先提取出该语音中的语音特征值,然后在上述数据库中查找该语音特征值,从而查找出该语音特征值对应的关键字。
另外,需要说明的是,本实施例中的所述的关键字包括数字、字母、单词、单个文字、词语、短句等。
进一步地,上述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
判断所述控制信息中是否存在任意控制信息与所述关键字相同;
当所述控制信息中存在任意控制信息与所述关键字相同时,则触发所述任意控制信息对应的可操作控件。
具体的,本实施例中,在识别出检测到的语音中包含的关键词之后,在上述可操作控件对应的控制信息中查找该关键词,当任意可操作控件对应的控制信息与上述语音中的关键词相同时,则触发该可操作控件。
为了更好的理解本发明,以图3为例,假设上述语音中包含的关键词为“1”,则在上述可操作控件对应的控制信息中查找关键词“1”,当检测到可操作控件“上一曲”对应的控制信息也为“1”时,则触发该可操作控件“上一曲”,此时,移动终端自动将音乐播放器当前的歌曲切换为上一首。
本实施例所述的语音控制方法,通过检测移动终端显示界面中的可操作控件,然后生成与该可操作控件一一对应的控制信息,并向用户进行展示,以使用户根据该控制信息来向移动终端发出语音控制指令;同时,检测并识别移动终端周围环境产生的语音,当该语音中的关键字与任意控制信息相同时,则触发该任意控制信息对应的可操作控件,本方法不需要用户预先在移动终端中保存与控制操作相关的语音,也不需要将保存的语音与移动终端中具体的控制操作进行绑定,便可实现利用语音控制移动终端,解决了现有技术中利用语音控制移动终端时,操作过程较为繁琐的技术问题。
进一步地,基于本发明语音控制方法第一实施例,提出本发明语音控制方法第二实施例,本发明语音控制方法第二实施例中,上述将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示的步骤之后还包括:
当检测到移动终端显示界面切换之后,则重新检测移动终端当前显示界面中的可操作控件,并重新生成与移动终端当前显示界面中的可操作控件一一对应的控制信息。
可以理解的是,移动终端在运行不同的应用时,其显示界面上的可操作控件并不相同,例如,移动终端从音乐播放器主界面切换到聊天界面时,其显示界面中的可操作控件就会随之而变化。
因此,本实施例中,当检测到移动终端显示界面切换之后,则重新检测移动终端当前显示界面中的可操作控件,并重新生成与移动终端当前显示界面中的可操作控件一一对应的控制信息,然后将重新生成的控制信息在移动终端显示界面进行显示。
其中,当检测到移动终端显示界面切换之后,便将切换之前显示界面中的可操作控件对应的控制信息进行删除或者清空,然后在移动终端显示界面显示重新检测到的可操作控件对应的控制信息。
以图3为例,图3中,可操作控件“上一曲”对应控制信息为“1”,“播放/暂停”对应的控制信息为“2”,当检测到移动终端的显示界面切换之后,此时,移动终端显示界面中具有可操作控件“X”和可操作控件“Y”,其中,可操作控件“X”对应生成的控制信息为“1”,可操作控件“Y”对应生成的控制信息为“2”。当检测到移动终端周围环境中产生的语音中包含关键词“1”时,则自动触发上述可操作控件“X”,而不是上述可操作控件“上一曲”。
本实施例所述的语音控制方法,当检测到移动终端显示界面切换之后,则重新检测移动终端当前显示界面中的可操作控件,并重新生成与移动终端当前显示界面中的可操作控件一一对应的控制信息,然后将重新生成的控制信息在移动终端显示界面进行显示,使得用户能够利用语音准确的控制移动终端当前显示界面中显示的应用程序,提升了语音控制的准确性。
进一步地,基于上述本发明语音控制方法第一实施例,提出本发明语音控制方法第三实施例,本发明语音控制方法第三实施例中,上述可操作控件包括所述移动终端显示界面中的可点击操作控件、可滑动操作控件、可长按操作控件。
可以理解的是,移动终端显示界面一般都会具有多种操作方式,例如点击显示界面中的某个图标、滑动或者拖动显示界面中的某个设置开关、长按显示界面中某个图标等操作。
进一步地,上述触发所述任意控制信息对应的可操作控件的步骤包括:
当所述可操作控件为可点击操作控件时,则控制所述移动终端执行所述可点击操作控件对应的点击操作;
当所述可操作控件为可滑动操作控件时,则控制所述移动终端执行所述可滑动操作控件对应的滑动操作;
当所述可操作控件为可长按操作控件时,则控制所述移动终端执行所述可长按操作控件对应的长按操作。
具体的,当上述可操作控件为可点击操作控件时,如显示界面中的图标、虚拟按钮、菜单等,则控制所述移动终端自动执行该可点击操作控件对应的点击操作,如打开上述图标、虚拟按钮、菜单等。
当上述可操作控件为可滑动操作控件时,如显示界面中的设置开关、进度条、音量条等,则控制移动终端自动执行该可滑动操作控件对应的滑动操作。其中,当上述可滑动操作控件为设置开关时,则将该设置开关滑向对立的一端,如从“开”滑向“关”,或者从“关”滑向“开”;当上述可滑动操作控件为进度条时,则每触发一次该可滑动操作控件,该可滑动操作控件向前或者向后滑动设定的幅度(如滑动10%)。
当所述可操作控件为可长按操作控件时,则控制移动终端自动执行所述可长按操作控件对应的长按操作,例如长按3秒。
为了更好的理解本发明,参照图4,图4为本发明中移动终端显示界面中的可滑动操作控件示意图。
本实施例所述的语音控制方法,上述可操作控件包括所述移动终端显示界面中的可点击操作控件、可滑动操作控件、可长按操作控件,即本实施例中,用户可以利用语音来控制移动终端执行如点击、滑动、长按等各种不同操作,大大增加了语音控制的控制范围,具有较高的实用性。
进一步地,基于上述本发明语音控制方法第一、第二、第三实施例,提出本发明语音控制方法第四实施例,参照图5,图5为本发明语音控制方法第四实施例的流程示意图,本实施例中,上述图2所示步骤S10中所述的检测移动终端显示界面中的可操作控件之前还包括:
步骤S11,当接收到语音控制指令时,将所述移动终端切换为语音控制模式。
可以理解的是,在大多数情况下,用户主要还是通过触摸点击等操作方式来控制移动终端,只有当用户的双手被占用或者沾水,无法对移动终端进行操作时,才可能会利用语音来控制移动终端。因此,可以通过软件定义的方式,在移动终端中定义一种语音控制模式,在移动终端处于该模式时,用户便可以通过语音来控制移动终端,否则,移动终端正常工作。
其中,可以预先设置一种语音控制指令,当移动终端接收到该语音控制指令时,自动切换为语音控制模式。
其中,上述语音控制指令可以设置与移动终端系统控制菜单中,具体可以设置为“开”or“关”两种状态;或者上述语音控制指令还可以关联设置于移动终端实体按键,如当用户同时按下“音量+”按键与“电源”按键时,移动终端则自动切换为语音控制模式;或者,还可以预先设置一种特殊的控制语音,来控制移动终端则自动切换为语音控制模式,例如,用户可以对着移动终端读出“开启语音控制”,来控制移动终端则切换为语音控制模式。
另外,在将移动终端切换为语音控制模式之后,还可以通过上述方式将移动终端切换到普通工作模式,由此可以有效的防止移动终端误操作。
进一步地,上述图2所示步骤S30中所述的当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
当所述语音中的关键字与任意控制信息相同时,判断所述移动终端当前是否处于语音控制模式;
若所述移动终端当前处于语音控制模式,则触发所述任意控制信息对应的可操作控件,若所述移动终端当前处于非语音控制模式,则保持所述任意控制信息对应的可操作控件当前的状态。
本实施例所述的语音控制方法,当接收到语音控制指令时,则将移动终端切换为语音控制模式,在该模式下,用户即可对移动终端进行语音控制,否则无法对移动终端进行语音控制,由此可以有效的防止移动终端误操作。
进一步地,本发明还提供一种移动终端,该移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音控制程序,所述语音控制程序被所述处理器执行时实现如下步骤:
检测移动终端显示界面中的可操作控件;
生成与所述可操作控件一一对应的控制信息;
检测并识别移动终端周围环境产生的语音,当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件。
进一步地,上述生成与所述可操作控件一一对应的控制信息的步骤之后,上述语音控制程序被所述处理器执行时,还可以实现如下步骤:
将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示。
进一步地,上述将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示的步骤之后,上述语音控制程序被所述处理器执行时,还可以实现如下步骤:
当检测到移动终端显示界面切换之后,则重新检测移动终端当前显示界面中的可操作控件,并重新生成与移动终端当前显示界面中的可操作控件一一对应的控制信息。
进一步地,上述检测并识别移动终端周围环境产生的语音的步骤包括:
检测移动终端周围环境产生的语音,并利用预置的语音识别算法提取出所述语音中的语音特征值,根据所述语音特征值识别出所述语音中包含的关键字。
进一步地,上述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
判断所述控制信息中是否存在任意控制信息与所述关键字相同;
当所述控制信息中存在任意控制信息与所述关键字相同时,则触发所述任意控制信息对应的可操作控件。
进一步地,上述可操作控件包括所述移动终端显示界面中的可点击操作控件、可滑动操作控件、可长按操作控件,上述触发所述任意控制信息对应的可操作控件的步骤包括:
当所述可操作控件为可点击操作控件时,则控制所述移动终端执行所述可点击操作控件对应的点击操作;
当所述可操作控件为可滑动操作控件时,则控制所述移动终端执行所述可滑动操作控件对应的滑动操作;
当所述可操作控件为可长按操作控件时,则控制所述移动终端执行所述可长按操作控件对应的长按操作。
进一步地,上述检测移动终端显示界面中的可操作控件的步骤之前,上述语音控制程序被所述处理器执行时,还可以实现如下步骤:
当接收到语音控制指令时,将所述移动终端切换为语音控制模式。
进一步地,上述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
当所述语音中的关键字与任意控制信息相同时,判断所述移动终端当前是否处于语音控制模式;
若所述移动终端当前处于语音控制模式,则触发所述任意控制信息对应的可操作控件,若所述移动终端当前处于非语音控制模式,则保持所述任意控制信息对应的可操作控件当前的状态。
为了更好的理解本发明,参照图6,图6为本发明移动终端涉及的软件运行环境的结构示意图,本实施例中,上述移动终端100可包括:处理器110,例如CPU,网络接口1004,用户接口1003,存储器109,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括上述图1所示的接口单元108与显示单元106;网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器109可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器;存储器109可选的还可以是独立于前述处理器110的存储装置。
本领域技术人员可以理解,图6中示出的结构并不构成对上述移动终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图6所示,作为一种存储介质的存储器109中,可以包括操作系统、网络通信模块、用户接口模块以及语音控制程序。
如图6所示,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器110可以用于调用存储器109中存储的语音控制程序,并执行相应的操作。
上述移动终端可实现:通过检测移动终端显示界面中的可操作控件,然后生成与该可操作控件一一对应的控制信息,并向用户进行展示,以使用户根据该控制信息来向移动终端发出语音控制指令;同时,检测并识别移动终端周围环境产生的语音,当该语音中的关键字与任意控制信息相同时,则触发该任意控制信息对应的可操作控件,不需要用户预先在移动终端中保存与控制操作相关的语音,也不需要将保存的语音与移动终端中具体的控制操作进行绑定,便可实现利用语音控制移动终端,解决了现有技术中利用语音控制移动终端时,操作过程较为繁琐的技术问题。
其中,上述移动终端对应的实施例与前述语音控制方法对应的各个实施例基本相同,故在此不再赘述。
本发明还提供一种存储介质,该存储介质上存储有语音控制程序,所述语音控制程序被处理器执行时实现如下步骤:
检测移动终端显示界面中的可操作控件;
生成与所述可操作控件一一对应的控制信息;
检测并识别移动终端周围环境产生的语音,当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件。
进一步地,上述生成与所述可操作控件一一对应的控制信息的步骤之后,上述语音控制程序被所述处理器执行时,还可以实现如下步骤:
将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示。
进一步地,上述将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示的步骤之后,上述语音控制程序被所述处理器执行时,还可以实现如下步骤:
当检测到移动终端显示界面切换之后,则重新检测移动终端当前显示界面中的可操作控件,并重新生成与移动终端当前显示界面中的可操作控件一一对应的控制信息。
进一步地,上述检测并识别移动终端周围环境产生的语音的步骤包括:
检测移动终端周围环境产生的语音,并利用预置的语音识别算法提取出所述语音中的语音特征值,根据所述语音特征值识别出所述语音中包含的关键字。
进一步地,上述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
判断所述控制信息中是否存在任意控制信息与所述关键字相同;
当所述控制信息中存在任意控制信息与所述关键字相同时,则触发所述任意控制信息对应的可操作控件。
进一步地,上述可操作控件包括所述移动终端显示界面中的可点击操作控件、可滑动操作控件、可长按操作控件,上述触发所述任意控制信息对应的可操作控件的步骤包括:
当所述可操作控件为可点击操作控件时,则控制所述移动终端执行所述可点击操作控件对应的点击操作;
当所述可操作控件为可滑动操作控件时,则控制所述移动终端执行所述可滑动操作控件对应的滑动操作;
当所述可操作控件为可长按操作控件时,则控制所述移动终端执行所述可长按操作控件对应的长按操作。
进一步地,上述检测移动终端显示界面中的可操作控件的步骤之前,上述语音控制程序被所述处理器执行时,还可以实现如下步骤:
当接收到语音控制指令时,将所述移动终端切换为语音控制模式。
进一步地,上述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
当所述语音中的关键字与任意控制信息相同时,判断所述移动终端当前是否处于语音控制模式;
若所述移动终端当前处于语音控制模式,则触发所述任意控制信息对应的可操作控件,若所述移动终端当前处于非语音控制模式,则保持所述任意控制信息对应的可操作控件当前的状态。
上述存储介质可实现:通过检测移动终端显示界面中的可操作控件,然后生成与该可操作控件一一对应的控制信息,并向用户进行展示,以使用户根据该控制信息来向移动终端发出语音控制指令;同时,检测并识别移动终端周围环境产生的语音,当该语音中的关键字与任意控制信息相同时,则触发该任意控制信息对应的可操作控件,不需要用户预先在移动终端中保存与控制操作相关的语音,也不需要将保存的语音与移动终端中具体的控制操作进行绑定,便可实现利用语音控制移动终端,解决了现有技术中利用语音控制移动终端时,操作过程较为繁琐的技术问题。
其中,上述存储介质对应的实施例与前述语音控制方法对应的各个实施例基本相同,故在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音控制方法,其特征在于,所述语音控制方法包括:
检测移动终端显示界面中的可操作控件;
生成与所述可操作控件一一对应的控制信息;
检测并识别移动终端周围环境产生的语音,当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件。
2.如权利要求1所述的语音控制方法,其特征在于,所述生成与所述可操作控件一一对应的控制信息的步骤之后还包括:
将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示。
3.如权利要求2所述的语音控制方法,其特征在于,将所述可操作控件与其对应的控制信息进行关联,并将关联后的控制信息在所述移动终端显示界面进行显示的步骤之后还包括:
当检测到移动终端显示界面切换之后,则重新检测移动终端当前显示界面中的可操作控件,并重新生成与移动终端当前显示界面中的可操作控件一一对应的控制信息。
4.如权利要求1所述的语音控制方法,其特征在于,所述检测并识别移动终端周围环境产生的语音的步骤包括:
检测移动终端周围环境产生的语音,并利用预置的语音识别算法提取出所述语音中的语音特征值,根据所述语音特征值识别出所述语音中包含的关键字。
5.如权利要求1所述的语音控制方法,其特征在于,所述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
判断所述控制信息中是否存在任意控制信息与所述关键字相同;
当所述控制信息中存在任意控制信息与所述关键字相同时,则触发所述任意控制信息对应的可操作控件。
6.如权利要求1所述的语音控制方法,其特征在于,所述可操作控件包括所述移动终端显示界面中的可点击操作控件、可滑动操作控件、可长按操作控件,所述触发所述任意控制信息对应的可操作控件的步骤包括:
当所述可操作控件为可点击操作控件时,则控制所述移动终端执行所述可点击操作控件对应的点击操作;
当所述可操作控件为可滑动操作控件时,则控制所述移动终端执行所述可滑动操作控件对应的滑动操作;
当所述可操作控件为可长按操作控件时,则控制所述移动终端执行所述可长按操作控件对应的长按操作。
7.如权利要求1至6任意一项所述的语音控制方法,其特征在于,所述检测移动终端显示界面中的可操作控件的步骤之前还包括:
当接收到语音控制指令时,将所述移动终端切换为语音控制模式。
8.如权利要求7所述的语音控制方法,其特征在于,所述当所述语音中的关键字与任意控制信息相同时,则触发所述任意控制信息对应的可操作控件的步骤包括:
当所述语音中的关键字与任意控制信息相同时,判断所述移动终端当前是否处于语音控制模式;
若所述移动终端当前处于语音控制模式,则触发所述任意控制信息对应的可操作控件,若所述移动终端当前处于非语音控制模式,则保持所述任意控制信息对应的可操作控件当前的状态。
9.一种移动终端,其特征在于,所述移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音控制程序,所述语音控制程序被所述处理器执行时实现如权利要求1至8中任一项所述的语音控制方法对应的各个步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有语音控制程序,所述语音控制程序被处理器执行时实现如权利要求1至8中任一项所述的语音控制方法对应的各个步骤。
CN201710530612.5A 2017-06-30 2017-06-30 语音控制方法、移动终端及存储介质 Pending CN107358953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710530612.5A CN107358953A (zh) 2017-06-30 2017-06-30 语音控制方法、移动终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710530612.5A CN107358953A (zh) 2017-06-30 2017-06-30 语音控制方法、移动终端及存储介质

Publications (1)

Publication Number Publication Date
CN107358953A true CN107358953A (zh) 2017-11-17

Family

ID=60291667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710530612.5A Pending CN107358953A (zh) 2017-06-30 2017-06-30 语音控制方法、移动终端及存储介质

Country Status (1)

Country Link
CN (1) CN107358953A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102808A (zh) * 2018-10-25 2018-12-28 珠海格力电器股份有限公司 一种基于显示交互的本地语音识别系统及其方法
CN109646952A (zh) * 2018-12-14 2019-04-19 北京智明星通科技股份有限公司 一种互动游戏界面显示方法、装置及终端
CN109782920A (zh) * 2019-01-30 2019-05-21 上海趣虫科技有限公司 一种用于扩展现实的人机交互方法及处理终端
CN109847348A (zh) * 2018-12-27 2019-06-07 努比亚技术有限公司 一种操作界面的操控方法及移动终端、存储介质
CN110060672A (zh) * 2019-03-08 2019-07-26 华为技术有限公司 一种语音控制方法及电子设备
CN110136718A (zh) * 2019-05-31 2019-08-16 深圳市语芯维电子有限公司 语音控制的方法和装置
CN110428832A (zh) * 2019-07-26 2019-11-08 苏州蜗牛数字科技股份有限公司 一种自定义语音实现屏幕控制的方法
CN110691160A (zh) * 2018-07-04 2020-01-14 青岛海信移动通信技术股份有限公司 一种语音控制方法、装置及手机
CN110874252A (zh) * 2018-08-30 2020-03-10 Tcl集团股份有限公司 一种焦点控制方法、装置及设备

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110691160A (zh) * 2018-07-04 2020-01-14 青岛海信移动通信技术股份有限公司 一种语音控制方法、装置及手机
CN110874252A (zh) * 2018-08-30 2020-03-10 Tcl集团股份有限公司 一种焦点控制方法、装置及设备
CN109102808A (zh) * 2018-10-25 2018-12-28 珠海格力电器股份有限公司 一种基于显示交互的本地语音识别系统及其方法
CN109646952A (zh) * 2018-12-14 2019-04-19 北京智明星通科技股份有限公司 一种互动游戏界面显示方法、装置及终端
CN109847348A (zh) * 2018-12-27 2019-06-07 努比亚技术有限公司 一种操作界面的操控方法及移动终端、存储介质
CN109847348B (zh) * 2018-12-27 2022-09-27 努比亚技术有限公司 一种操作界面的操控方法及移动终端、存储介质
CN109782920A (zh) * 2019-01-30 2019-05-21 上海趣虫科技有限公司 一种用于扩展现实的人机交互方法及处理终端
CN110060672A (zh) * 2019-03-08 2019-07-26 华为技术有限公司 一种语音控制方法及电子设备
WO2020181988A1 (zh) * 2019-03-08 2020-09-17 华为技术有限公司 一种语音控制方法及电子设备
CN110136718A (zh) * 2019-05-31 2019-08-16 深圳市语芯维电子有限公司 语音控制的方法和装置
CN110428832A (zh) * 2019-07-26 2019-11-08 苏州蜗牛数字科技股份有限公司 一种自定义语音实现屏幕控制的方法

Similar Documents

Publication Publication Date Title
CN107358953A (zh) 语音控制方法、移动终端及存储介质
CN109032734B (zh) 一种后台应用程序显示方法和移动终端
CN107145293A (zh) 一种截图方法、移动终端及存储介质
CN110933511B (zh) 一种视频分享方法、电子设备及介质
CN107621914A (zh) 终端功能控键的显示方法、终端及计算机可读存储介质
CN107809526A (zh) 终端应用程序分类方法、移动终端及计算机可读存储介质
CN107402694A (zh) 应用切换方法、设备和计算机可读存储介质
CN109634438B (zh) 一种输入法的控制方法及终端设备
CN109078319A (zh) 一种游戏界面显示方法和终端
CN109343755A (zh) 一种文件处理方法及终端设备
CN109582475A (zh) 一种分享方法及终端
CN107633051A (zh) 桌面搜索方法、移动终端及计算机可读存储介质
CN108052251A (zh) 一种截屏信息显示方法和移动终端
CN107908705A (zh) 一种信息推送方法、信息推送装置及移动终端
CN108170341A (zh) 界面操作按键自适应方法、终端及计算机可读存储介质
CN109710165A (zh) 一种绘图处理方法及移动终端
CN107885428A (zh) 终端分屏启动方法、终端及计算机可读存储介质
CN107765941A (zh) 一种图标显示方法、终端及计算机可读存储介质
CN109847348A (zh) 一种操作界面的操控方法及移动终端、存储介质
CN108228033A (zh) 一种消息显示方法及移动终端
CN107992455A (zh) 一种文本处理方法、终端及计算机可读存储介质
CN109976640A (zh) 一种内容复制方法及终端
CN108509108A (zh) 一种应用程序图标排列方法及移动终端
CN108762648A (zh) 屏幕操作控制方法及移动终端
CN108536349A (zh) 一种图标管理方法及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171117