CN103853463A - 语音操控方法及装置 - Google Patents

语音操控方法及装置 Download PDF

Info

Publication number
CN103853463A
CN103853463A CN201410068778.6A CN201410068778A CN103853463A CN 103853463 A CN103853463 A CN 103853463A CN 201410068778 A CN201410068778 A CN 201410068778A CN 103853463 A CN103853463 A CN 103853463A
Authority
CN
China
Prior art keywords
operational order
time
voice
word
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410068778.6A
Other languages
English (en)
Inventor
林焜
邓一弓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHUHAI DUOWAN INFORMATION TECHNOLOGY Ltd
Original Assignee
ZHUHAI DUOWAN INFORMATION TECHNOLOGY Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHUHAI DUOWAN INFORMATION TECHNOLOGY Ltd filed Critical ZHUHAI DUOWAN INFORMATION TECHNOLOGY Ltd
Priority to CN201410068778.6A priority Critical patent/CN103853463A/zh
Publication of CN103853463A publication Critical patent/CN103853463A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种语音操控方法及装置,属于计算机技术领域。所述方法包括:获取语音信号;分析识别所述语音信号,得到语音内容;将所述语音内容与目标对象进行匹配,所述目标对象由若干个对象组合而成;从所述目标对象中选取出所述语音内容所指示的对象。本发明通过分析识别语音信号,从目标对象中选取出语音信号所指示的对象;可以降低用户误操作的可能性;同时解放了用户的双手,提高了用户操作的效率,大大改善了用户体验。

Description

语音操控方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种语音操控方法及装置。
背景技术
随着智能移动终端的迅速发展,越来越多的应用程序转移到了智能手机中,比如浏览器、游戏类的应用程序、用于播放视频或音频的播放应用程序等。
在智能手机中运行某一个应用程序时,用户可以通过触碰智能手机屏幕上的功能按键,完成对该应用程序的操作。以播放器为例,用户可以点击播放器上的设置的“开始/暂停”按键以开始播放,或者再次点击“开始/暂停”按键以暂停播放,用户还可以点击“快进”按键以跳转至后面需要播放的某帧。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:由于受到智能手机屏幕尺寸的限定,在一些包含有较多控件的应用程序中,通常会将控件设置的比较小,而较小的控件容易导致用户操作的失误。
发明内容
为了解决现有技术中由于受到智能手机屏幕尺寸的限定,容易导致用户误操作的问题,本发明实施例提供了一种语音操控方法及装置。所述技术方案如下:
第一方面,提供了一种语音操控方法,应用于终端中,所述方法包括:
获取语音信号;
分析识别所述语音信号,得到由至少一个关键词组成的语音内容;
将所述语音内容与目标对象进行匹配,所述目标对象由若干个对象组合而成;
从所述目标对象中选取出所述语音内容所指示的对象。
进一步的,所述语音内容包括至少一组对应关系,每组对应关系包括一个关键词和一个对象指代词,所述从所述目标对象中选取出所述语音内容所指示的对象,包括:
从所述目标对象中选取出预定个数的与所述对象指代词匹配的对象,所述预定个数为在与所述对象指代词同组对应关系中的关键词所指定的个数;
所述语音内容包括至少一个对象指代词,所述从目标对象中选取出所述语音内容所指示的对象,包括:
从所述目标对象中选取出与各个所述对象指代词匹配的对象。
进一步的,在所述从所述目标对象中选取出所述语音内容所指示的对象之后,还包括:
检测在预定时间段内是否接收到通过预定方式产生的操作指令;
若在所述预定时间段内接收到所述操作指令,即刻对选取出的所述对象按照所述操作指令进行相应操作;
若在所述预定时间段内未接收到所述操作指令,则在等待所述预定时间段之后进行默认的特定操作。
进一步的,所述通过预定方式产生的操作指令为:
指示将选取出的所述对象进行相关操作的语音操作指令;
或,
第一预定手势触碰终端屏幕时所产生的操作指令;
或,
在所述终端的距离传感器上通过第二预定手势所产生的操作指令。
进一步的,在所述从所述目标对象中选取出与所述语音内容所指示的对象之后,还包括:
检测在预定时间段内是否接收到阻止操作指令;
若在所述预定时间段内接收到所述阻止操作指令,则还原选取出的所述对象,并继续执行所述获取语音信号的步骤;
若在所述预定时间段内未接收到所述阻止操作指令,则在等待所述预定时间段之后进行默认的所述特定操作。
进一步的,在所述获取语音信号之前,还包括:
接收作用于显示在所述终端上的语音录入按钮时所产生的录入指令;
或,
接收下发给所述终端的所述录入指令。
第二方面,提供了一种语音操控装置,应用于终端中,所述装置包括:
获取模块,用于获取语音信号;
分析模块,用于分析识别所述获取模块获取的所述语音信号,得到语音内容;
匹配模块,将所述分析模块得到的语音内容与目标对象进行匹配,所述目标对象由若干个对象组合而成;
选取模块,用于从所述目标对象中选取出所述语音内容所指示的对象。
进一步的,所述语音内容包括至少一组对应关系,每组对应关系包括一个关键词和一个对象指代词,所述选取模块,还用于:
从所述目标对象中选取出预定个数的与所述对象指代词匹配的对象,所述预定个数为在与所述对象指代词同组对应关系中的关键词所指定的个数;
或,
所述语音内容包括至少一个对象指代词,所述选取模块,还用于:
从所述目标对象中选取出与各个所述对象指代词匹配的对象。
进一步的,所述装置还包括:
第一检测模块,用于检测在预定时间段内是否接收到通过预定方式产生的操作指令;
第一操作模块,用于在所述预定时间段内接收到所述操作指令时,即刻对选取出的所述对象按照所述操作指令进行相应操作;
第二操作模块,用于所述预定时间段内未接收到所述操作指令时,则在等待所述预定时间段之后进行默认的特定操作。
进一步的,所述通过预定方式产生的操作指令为:
指示将选取出的所述对象进行相关操作的语音操作指令;
或,
第一预定手势触碰终端屏幕时所产生的操作指令;
或,
在所述终端的距离传感器上通过第二预定手势所产生的操作指令。
进一步的,所述装置还包括:
第二检测模块,用于检测在所述预定时间段内是否接收到阻止操作指令;
还原模块,用于在所述预定时间段内接收到所述阻止操作指令时,还原选取出的所述对象,并继续执行所述获取语音信号的步骤;
第三操作模块,用于在所述预定时间段内未接收到所述阻止操作指令时,在等待所述预定时间段之后进行默认的所述特定操作。
进一步的,所述装置还包括:
第一接收模块,用于接收作用于显示在所述终端上的语音录入按钮时所产生的录入指令;
或,
第二接收模块,用于接收下发给所述终端的所述录入指令。
本发明实施例提供的技术方案带来的有益效果是:
通过分析识别语音信号,从目标对象中选取出语音信号所指示的对象;可以降低用户误操作的可能性;同时解放了用户的双手,提高了用户操作的效率,大大改善了用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例中提供的语音操控方法的方法流程图;
图2A是本发明另一个实施例中提供的语音操控方法的方法流程图;
图2B-2D是本发明提供的终端分别在三种场景中提供的语音录入按钮的示意图;
图2E-2F是本发明提供的终端分别在两种场景中提供的自动提醒用户进行语音录入时的示意图;
图2G是图2C中的多个对象被选取出的示意图;
图2H是本发明一个实施例中提供的通过第一预定手势产生操作指令的示意图;
图2I是本发明一个实施例中提供的通过距离传感器生成操作指令的示意图;
图2J是本发明一个实施例中提供的释放选取对象的示意图;
图2K是本发明另一个实施例中提供的释放选取对象的示意图;
图2L是本发明一个实施例中提供的播放选取对象的示意图;
图3是本发明一个实施例中提供的语音操控装置的结构示意图;
图4是本发明另一个实施例中提供的语音操控装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
请参见图1所示,其示出了本发明一个实施例中提供的语音操控方法的方法流程图,该语音操控方法可以应用于终端中,这里所讲的终端可以包括智能手机、平板电脑、智能电视、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。该语音操控方法可以包括:
101,获取语音信号;
102,分析识别语音信号,得到语音内容;
103,将语音内容与目标对象进行匹配,目标对象由若干个对象组合而成;
104,从目标对象中选取出语音内容所指示的对象。
综上所述,本发明实施例中提供的语音操控方法,通过分析识别语音信号,从目标对象中选取出语音信号所指示的对象;可以降低用户误操作的可能性;同时解放了用户的双手,提高了用户操作的效率,大大改善了用户体验。
请参见图2A所示,其示出了本发明一个实施例中提供的语音操控方法的方法流程图,该语音操控方法可以应用于终端中,这里所讲的终端可以包括智能手机、平板电脑、智能电视、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机等等。该语音操控方法可以包括:
201,接收录入指令;
终端在接收到录入指令之后,终端上的麦克风则开始工作,该麦克风可以收集用户输入的语音信号。
在实际应用中,终端可以接收到多种方式发送来的录入指令,比如,接收作用于显示在终端上的语音录入按钮时所产生的录入指令;还比如,接收下发给终端的录入指令。
举例来讲,终端屏幕上可以设置有语音录入按钮,用户在触屏该语音录入按钮之后,终端则可以对应接收到录入指令。比如,以消除任务的应用场景为例,某一项任务可以对应一个提示时间,当到达一个提示时间时,则会在终端上显示出一个语音录入按钮,用户可以点击该语音录入按钮,请参见图2B所示,其中设置有语音录入按钮b。还比如,以斗地主游戏为例,当终端处于出牌状态时,则终端上显示出一个语音录入按钮,用户可以点击该语音录入按钮,请参见图2C所示,其中设置有语音录入按钮c。再比如,以播放视频为例,当终端打开视频播放应用程序或播放引擎时,终端的屏幕上则显示出一个语音录入按钮,用户可以点击该语音录入按钮,请参见图2D所示,其中设置有语音录入按钮d。
再举例来讲,在互联网的应用场景中,服务器可以向终端下发录入指令,对应的,终端则可以接收到服务器下发的录入指令。比如,以斗地主游戏为例,当服务器判定该终端需要从等待状态转换为出牌状态,则可以向该终端下发录入指令,提醒用户进行语音录入,请参见图2E所示,此时不需要用户点击语音录入按钮,即可实现对用户的语音信号的录入。还比如,以视频播放为例,当终端打开了视频播放客户端,则该视频播放客户端所对应的服务器会自动向该客户端下发录入指令,提醒用于进行语音录入,请参见图2F所示。
202,获取语音信号;
当终端在接收到录入指令之后,则可以开启麦克风,通过该麦克风对用户输入的语音信号进行录制,并将录制得到的语音信号传送给终端的处理器。
203,分析识别语音信号,得到语音内容;
根据语言逻辑,可以将语音信号解析出由多个词组成的一句话。在解析语音信号时,需要确定每一个发音所对应的字或词,因此需要将每一个发音与数据库中的字或词进行匹配,当匹配成功,则可以确定该发音所对应的字或词。不同的是,这里所讲的数据库中的字或词是非常有限的,在进行语音识别时的运算量比较小,因此完全可以在终端侧(尤其是智能手机或内存比较小的掌上电脑等)实现语音的内容识别。
以任务消除的应用场景为例,通常来讲,用户在终端设置一段时间(一天、一周、一个月或一年等)的工作任务时,这些工作任务也是有限的,比如可以包括:安排进程、发送邮件、整理文档、写报告、开会、会议总结等。因此根据完成的任务所能够确定的并放置于数据库中的字或词也是非常有限的,比如,在该数据库中可以放置的字或词可以包括:完成、任务、安排进程、发送邮件、整理文档、写报告、开会、会议总结。
以纸牌游戏为例,由于在某一个纸牌游戏中,牌型和出牌规则是有限的,因此根据出牌时能够出的牌型所确定的并放置于数据库中的字或词是非常有限的,比如,该数据库中可以放置的字或词通常可以包括:一张、两张、三张、四张、一个、两个、三个、四个、对、一对、带张、A、2至10、J、Q、K、大王和小王。因此仅需要将每一个发音或连续的两个发音与上面数据库中的字或词进行匹配即可,当匹配成功时则可以确定该发音所对应的字或词。
以视频播放为例,由于在显示的播放视频中,播放视频的数量是有限的,因此根据显示的播放视频所确定的并放置于数据库中的字或词也是非常有限的,比如,该数据库中可以放置的字或词通常可以包括各个播放视频的名称或者可唯一识别播放视频的字或词。
在一种情况下,解析出的语音内容中可以包括至少一组对应关系,每组对应关系包括一个关键词和一个对象指代词,其中对象指代词为对指代的对象的描述。以纸牌游戏为例,当解析出的语音内容包括“三张2带对K”时,该语音内容包含有对应关系“三张3”和对应关系“带对K”,对应关系“三张3”中的“三张”则可以认定为关键词,后面的“3”则可以认定为对象指代词;对应关系“带对K”中的“带对”则可以认定为关键词,后面的“K”则可以认定为对象指代词。
在另一种情况下,解析出的语音内容中可以仅包括对象指代词。以纸牌游戏为例,当解析出的语音内容包括“910J Q K A”时,该语音内容可以包括六个对象指代词“6”“10”、“J”、“Q”、“K”、“A”。以任务消除的应用场景为例,当解析出的语音内容包括“会议任务”时,可以将该语音内容“会议任务”认定为对象指代词。再以视频播放为例,当解析出的语音内容包括视频名称“动物乐园”时,可以将该语音内容“动物乐园”认定为对象指代词。
需要补充说明的是,由于不同的业务对应不同的对象,因此关键词和对象指代词均可以根据业务类型进行设定,但通常来讲,这里所讲的关键词以及对象指代词的个数是非常有限的个数。
204,将语音内容与目标对象进行匹配,目标对象由若干个对象组合而成;
这里所讲的目标对象可以是一个,也可以是多个,可以是同类型的对象组合而成,也可以是不同类型的对象组合而成。
对象指代词通常与对象对应,比如,当纸牌游戏中的语音内容为“一对2”,其中“2”即为对象指代词,则该对象指代词对应着纸牌对象2。还比如,当视频播放应用中的语音内容为“动物乐园”,则“动物乐园”为对象指代词,则该对象指代词对应着视频对象“动物乐园”。
205,从目标对象中选取出语音内容所指示的对象;
当语音内容包括至少一组对应关系,且每组对应关系包括一个关键词和一个对象指代词时,从目标对象中选取出语音内容所指示的对象,可以包括:从目标对象中选取出预定个数的与对象指代词匹配的对象,预定个数为在与对象指代词同组对应关系中的关键词所指定的个数。
例如,当语音内容为“三张3带对5”时,其中的“三张”为与“3”同组的关键词,“带对”为与“5”同组的关键词,在选取对象指代词“3”时,则需要选取同组关键词“三张”所对应的个数,即选取出的对象为三张“3”;在选取对象指代词“5”时,则需要选取同组关键词“带对”所对应的个数,即选择的对象为两站“5”,这样既选取出了三张“3”以及两张“5”。
当语音内容仅包括对象指代词时,从目标对象中选取出语音内容所指示的对象,可以包括:从目标对象中选取出与各个对象指代词匹配的对象。
例如,在任务消除的应用场景中,用户可以在终端的某一应用程序中建立当天需要完成的多个任务(即对象),在每完成一项任务之后,则选择完成的一项任务,比如录入的语音内容为“会议”,则可以选取出对象指代词“会议”所对应的对象;还比如用户在一个时间段内完成了两项或多项任务时,录入的语音内容为“会议和整理文档”,则可以选取出对象指代词“会议”所对应的对象以及对象指代词“整理文档”所对应的对象。
还例如,在视频或音频播放的应用场景中,用户可以通过语音录入选取出一个或多个视频或音频。比如,当用户录入的语音内容为“动物乐园”时,则可以选取出对象指代词“动物乐园”所对应的对象;还比如,当用户录入的语音内容为“动物乐园小鸡快跑流氓兔”时,可以选取出对象指代词“动物乐园”所对应的对象、还可以选取出对象指代词“小鸡快跑”所对应的对象以及对象指代词“流氓兔”所对应的对象。
还例如,在纸牌游戏中,服务器会为每一游戏中的终端下发预定个数的牌型,终端用户可以根据预定规则选取出一张、两张或多张牌型。比如,当用户录入的语音内容为“910J Q K A”时,该语音内容可以包括六个对象指代词“6”、“10”、“J”、“Q”、“K”、“A”,此时则可以分别选取出对象指代词“6”、“10”、“J”、“Q”、“K”、“A”所对应的六个对象。
206,检测在预定时间段内是否接收到通过预定方式产生的操作指令;
在实际应用中,通过预定方式产生的操作指令可以为:指示将选取出的对象进行相关操作的语音操作指令;或,第一预定手势触碰终端屏幕时所产生的操作指令;或,在终端的距离传感器上通过第二预定手势所产生的操作指令。
也就是说,终端可以通过如下三种方式接收到通过预定方式产生的操作指令:
第一种方式,终端接收用于指示将选取出的对象进行相关操作的语音操作指令。
也即,当终端在选取出对象之后,用户还可以输入用于指示对选取出的对象进行相关操作的语音操作指令,该语音操作指令可以根据具体业务类型进行设定,比如“舍弃”、“完成”、“出牌”、“打出”、“播放”等。在实际应用中,用户可以触碰终端屏幕上显示的语音录入按钮(如图2G所示,其为从图2C中选取出的对象为5至10的牌型后的示意图,用户可以再次点击语音录入按钮c),进行第二次语音信号(可称之为第二语音信号)的录入,这样终端可以接收并分析用户第二次录入的语音信号,并根据该语音信号的发音确定出该语音信号所对应的语音内容是否为预定的语音指令,比如是否为“出牌”,如果是,则执行步骤207,不如不是,则提醒用户重新录入语音信号。很显然,在有些情况下,并不设置录入按钮,当选取出对象之后,对用户进行录入提示,用户直接录入语音信号即可。
很显然,在一种可能的实现方式中,如果用户确认出终端在步骤205中选取出的对象是错误的,则可以进行重新录入,并重新执行步骤202至步骤205的步骤。
第二种方式,终端接收通过第一预定手势触碰终端屏幕时所产生的操作指令。
用户还可以通过第一预定手势在终端屏幕上进行触碰滑动,以产生操作指令。这里第一预定手势可以预先设定,比如可以通过预定手指(一指、两指、三指或四指等)从终端屏幕下方向上方滑动,或者可以通过预定手指(一指、两指、三指或四指等)从终端屏幕的左方向右方滑动,或者可以通过预定手指(一指、两指、三指或四指等)在终端屏幕上进行三角轨迹或圆形轨迹等各种几何轨迹的滑动。
在一种可能的实现方式中,如图2H所示,其示出了本发明一个实施例中提供的通过第一预定手势产生操作指令的示意图,当用户的手指作用于显示在终端上的语音录入按钮时进行录入指令的输入时,用户的手指可以一直按住该语音录入按钮,直到终端选取出牌型之后,如果判定选取出的牌型正确,则按住的手指则可以直接通过上划出牌;如果判定选取的牌型不正确,则按住的手指则可以直接通过下划取消选牌,并且推出语音监听模式,再执行语音选牌出牌时,需要再按住语音录入按钮。
第三种方式,终端接收在终端的距离传感器上通过第二预定手势所产生的操作指令。
终端上可以设置有距离传感器,这样用户可以直接在距离传感器所能感应的距离内进行滑动,即可以在终端的距离传感器上进行第二预定手势的滑动,这样,距离传感器在感应到第二预定手势的滑动时,会将相关的滑动信息发送给终端的处理器,终端的处理器则可以该第二预定手势滑动时所产生的操作指令。
如图2I所示,其示出了本发明一个实施例中提供的通过距离传感器生成操作指令的示意图,用户手指可以在距离传感器所能感应的预定距离和区域内进行预定手势的滑动。
207,若在预定时间段内接收到操作指令,即刻对选取出的对象按照操作指令进行相应操作;
比如,当操作指令为用于将选取出的对象进行释放的指令时,则当选取出的对象被释放之后,这些对象将不再显示在当前的目标对象中,或者这些对象将不再显示在该终端的屏幕上。
请参见图2J所示,其示出了本发明一个实施例中提供的释放选取对象的示意图,当选取出的对象为任务“会议”时,释放选取的对象后,将不再显示这些选取出的对象。
请参见图2K所示,其示出了本发明另一个实施例中提供的释放选取对象的示意图,当选取出的对象为牌型5至牌型10时,释放这些选取的对象后,将不再显示这些选取出的对象。
还比如,当操作指令用于将选取出的对象进行播放时,则选取出的对象开始被播放。请参见图2L所示,其示出了本发明一个实施例中提供的播放选取对象的示意图,当选取出的对象为“动物乐园”时,当接收到的操作指令为用于播放该对象的指令时,则开始播放该对象。
208,若在预定时间段内未接收到操作指令,则在等待预定时间段之后进行默认的特定操作;
这里所讲的默认的特定操作可以与操作指令所指示的操作相同。默认的特定操作可以根据实际的应用场景设定,以取消任务的场景为例,当在预定时间段内未接收到操作指令(比如用于指示将选取出的任务对象进行消除的操作指令),则在等待预定时间段之后将选取的任务对象进行消除;再以视频播放的场景为例,当在预定时间段内未接收到操作指令(比如用于指示播放选取出的视频对象的操作指令),则在等待预定时间段之后播放选取出的视频对象。
这里所讲的默认的特定操作也可以与操作指令所指示的操作不同。默认的特定操作可以根据实际的应用场景设定,仍以取消任务的场景为例,当在预定时间段内未接收到操作指令(比如用于指示将选取出的任务对象进行消除的操作指令),则在等待预定时间段之后将选取的任务对象还原,即将选取出的任务重新放入到目标对象的队列中,此时则不再有选取出的对象;仍再以视频播放的场景为例,当在预定时间段内未接收到操作指令(比如用于指示播放选取出的视频对象的操作指令),则在等待预定时间段之后还原选取出的视频对象,即将选取出的视频重新放入到目标对象的队列中,此时则不再有选取出的对象。
209,检测在预定时间段内是否接收到阻止操作指令;
也就是说,当选取出对象之后,在预定时间段内既可以检测是否接收到操作指令,同时还可以检测是否接收到阻止操作指令。
阻止操作指令通常可以为用于指示对选取出的对象不进行操作指令所指示的操作。
在一种可能的实现场景中,如果用户在该预定时间段内发现终端选取出的对象不正确,则可以在该预定时间段结束前输入阻止操作指令(可以通过语音输入,也可以通过点击取消操作的按钮等)。比如,语音输入可以为“停”或“停止”等语音指令。
210,若在预定时间段内接收到阻止操作指令,则还原选取出的对象,并继续执行步骤202;
对应的,终端在接收到该阻止操作指令后,则还原选取出的对象,即此时不再存在选取出的对象,在还原选取出的对象时,可以将原本选取出的对象重新放入目标对象队列中;然后,可以接收用户再次输入的语音信号,即执行步骤202。
若在预定时间段内未接收到阻止操作指令,在等待预定时间段之后进行默认的特定操作。
如果终端在预定时间段内未接收到阻止操作指令,则表明用户认为选取出的对象是正确的,因此可以在预定时间段后可以进行默认的特定操作。同样,这里所讲的特定操作可以与操作指令所指示的操作相同,比如,在任务消除的场景中,特定操作可以为消除选取出的对象;还比如,在视频播放的场景中,特定操作可以为播放选取出的对象。
易于思及的是,还可以检测在该预定时间段内是否接收到用于指示其他操作的操作指令,比如,将选取出的对象移动到目标对象的最后位置的指令,或将选取出的对象进行特殊处理化的操作等,这里均不再一一详述。
综上所述,本发明实施例中提供的语音操控方法,通过分析识别语音信号,从目标对象中选取出语音信号所指示的对象;可以降低用户误操作的可能性;同时解放了用户的双手,提高了用户操作的效率,大大改善了用户体验。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参见图3所示,其示出了本发明一个实施例中提供的语音操控装置的结构示意图。该语音操控装置可以应用于终端中,这里所讲的终端可以包括智能手机、平板电脑、智能电视、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机等等。该语音操控装置可以包括但不限于:获取模块302、分析模块304、匹配模块306和选取模块308。
获取模块302,可以用于获取语音信号;
分析模块304,可以用于分析获取模块302获取的语音信号,得到语音内容;
匹配模块306,可以用于将分析模块304得到的语音内容与目标对象进行匹配,目标对象由若干个对象组合而成;
选取模块308,可以用于从目标对象中选取出语音内容所指示的对象。
综上所述,本发明实施例中提供的语音操控装置,通过分析识别语音信号,从目标对象中选取出语音信号所指示的对象;可以降低用户误操作的可能性;同时解放了用户的双手,提高了用户操作的效率,大大改善了用户体验。
请参见图4所示,其示出了本发明另一个实施例中提供的语音操控装置的结构示意图。该语音操控装置可以应用于终端中,这里所讲的终端可以包括智能手机、平板电脑、智能电视、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机等等。该语音操控装置可以包括但不限于:获取模块402、分析模块404、匹配模块406和选取模块408。
获取模块402,可以用于获取语音信号;
分析模块404,可以用于分析获取模块402获取的语音信号,得到语音内容;
匹配模块406,可以用于将分析模块404得到的语音内容与目标对象进行匹配,目标对象由若干个对象组合而成;
选取模块408,可以用于从目标对象中选取出语音内容所指示的对象。
在图4所示实施例中的第一种可能的实现方式中,语音内容包括至少一组对应关系,每组对应关系包括一个关键词和一个对象指代词,选取模块408,还可以用于:
从目标对象中选取出预定个数的与对象指代词匹配的对象,预定个数为在与对象指代词同组对应关系中的关键词所指定的个数;
或,
语音内容包括至少一个对象指代词,选取模块408,还可以用于:
从目标对象中选取出与各个对象指代词匹配的对象。
在图4所示实施例中的第二种可能的实现方式中,语音操控装置还可以包括:第一检测模块410、第一操作模块412和第二操作模块414。
第一检测模块410,可以用于检测在预定时间段内是否接收到通过预定方式产生的操作指令;
第一操作模块412,可以用于在预定时间段内接收到操作指令时,即刻对选取出的对象按照操作指令进行相应操作;
第二操作模块414,可以用于在预定时间段内未接收到操作指令时,则在等待预定时间段之后进行默认的特定操作。
在图4所示实施例中的第三种可能的实现方式中,通过预定方式产生的操作指令为:
指示将选取出的对象进行相关操作的语音操作指令;
或,
第一预定手势触碰终端屏幕时所产生的操作指令;
或,
在终端的距离传感器上通过第二预定手势所产生的操作指令。
在图4所示实施例中的第四种可能的实现方式中,语音操控装置还可以包括:第二检测模块416和还原模块418。
第二检测模块416,可以用于检测在预定时间段内是否接收到阻止操作指令;
还原模块418,可以用于在预定时间段内接收到阻止操作指令时,还原选取出的对象,并继续执行获取语音信号的步骤;
第二操作模块414,可以用于在预定时间段内未接收到阻止操作指令时,在等待预定时间段之后进行默认的特定操作。
在图4所示实施例中的第五种可能的实现方式中,语音操控装置还可以包括:第一接收模块420和第二接收模块422。
第一接收模块420,可以用于接收作用于显示在终端上的语音录入按钮时所产生的录入指令;
或,
第二接收模块422,可以用于接收下发给终端的录入指令。
综上,本发明实施例中提供的语音操控装置,通过分析识别语音信号,从目标对象中选取出语音信号所指示的对象;可以降低用户误操作的可能性;同时解放了用户的双手,提高了用户操作的效率,大大改善了用户体验。
需要说明的是:上述实施例中提供的语音操控装置在通过语音操控时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将终端的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音操控装置与语音操控方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种语音操控方法,应用于终端中,其特征在于,所述方法包括:
获取语音信号;
分析识别所述语音信号,得到语音内容;
将所述语音内容与目标对象进行匹配,所述目标对象由若干个对象组合而成;
从所述目标对象中选取出所述语音内容所指示的对象。
2.根据权利要求1所述的方法,其特征在于,所述语音内容包括至少一组对应关系,每组对应关系包括一个关键词和一个对象指代词,所述从所述目标对象中选取出所述语音内容所指示的对象,包括:
从所述目标对象中选取出预定个数的与所述对象指代词匹配的对象,所述预定个数为在与所述对象指代词同组对应关系中的关键词所指定的个数;
或,
所述语音内容包括至少一个对象指代词,所述从目标对象中选取出所述语音内容所指示的对象,包括:
从所述目标对象中选取出与各个所述对象指代词匹配的对象。
3.根据权利要求1所述的方法,其特征在于,所述从所述目标对象中选取出所述语音内容所指示的对象之后,还包括:
检测在预定时间段内是否接收到通过预定方式产生的操作指令;
若在所述预定时间段内接收到所述操作指令,即刻对选取出的所述对象按照所述操作指令进行相应操作;
若在所述预定时间段内未接收到所述操作指令,则在等待所述预定时间段之后进行默认的特定操作。
4.根据权利要求3所述的方法,其特征在于,所述通过预定方式产生的操作指令为:
指示将选取出的所述对象进行相关操作的语音操作指令;
或,
第一预定手势触碰终端屏幕时所产生的操作指令;
或,
在所述终端的距离传感器上通过第二预定手势所产生的操作指令。
5.根据权利要求1所述的方法,其特征在于,在所述从所述目标对象中选取出与所述语音内容所指示的对象之后,还包括:
检测在预定时间段内是否接收到阻止操作指令;
若在所述预定时间段内接收到所述阻止操作指令,则还原选取出的所述对象,并继续执行所述获取语音信号的步骤;
若在所述预定时间段内未接收到所述阻止操作指令,则在等待所述预定时间段之后进行默认的所述特定操作。
6.根据权利要求1至5中任一所述的方法,其特征在于,在所述获取语音信号之前,还包括:
接收点击显示在所述终端上的语音录入按钮时所产生的录入指令;
或,
接收下发给所述终端的所述录入指令。
7.一种语音操控装置,应用于终端中,其特征在于,所述装置包括:
获取模块,用于获取语音信号;
分析模块,用于分析识别所述获取模块获取的所述语音信号,得到语音内容;
匹配模块,将所述分析模块得到的语音内容与目标对象进行匹配,所述目标对象由若干个对象组合而成;
选取模块,用于从所述目标对象中选取出所述语音内容所指示的对象。
8.根据权利要求7所述的装置,其特征在于,所述语音内容包括至少一组对应关系,每组对应关系包括一个关键词和一个对象指代词,所述选取模块还用于:
从所述目标对象中选取出预定个数的与所述对象指代词匹配的对象,所述预定个数为在与所述对象指代词同组对应关系中的关键词所指定的个数;
或,
所述语音内容包括至少一个对象指代词,所述选取模块还用于:
从所述目标对象中选取出与各个所述对象指代词匹配的对象。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一检测模块,用于检测在预定时间段内是否接收到通过预定方式产生的操作指令;
第一操作模块,用于在所述预定时间段内接收到所述操作指令时,即刻对选取出的所述对象按照所述操作指令进行相应操作;
第二操作模块,用于在所述预定时间段内未接收到所述操作指令时,则在等待所述预定时间段之后进行默认的特定操作。
10.根据权利要求9所述的装置,其特征在于,所述通过预定方式产生的操作指令为:
指示将选取出的所述对象进行相关操作的语音操作指令;
或,
第一预定手势触碰终端屏幕时所产生的操作指令;
或,
在所述终端的距离传感器上通过第二预定手势所产生的操作指令。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二检测模块,用于检测在所述预定时间段内是否接收到阻止操作指令;
还原模块,用于在所述预定时间段内接收到所述阻止操作指令时,还原选取出的所述对象,并继续执行所述获取语音信号的步骤;
第二操作模块,还用于在所述预定时间段内未接收到所述阻止操作指令时,在等待所述预定时间段之后进行默认的所述特定操作。
12.根据权利要求7至11中任一所述的装置,其特征在于,所述装置还包括:
第一接收模块,用于接收作用于显示在所述终端上的语音录入按钮时所产生的录入指令;
或,
第二接收模块,用于接收下发给所述终端的所述录入指令。
CN201410068778.6A 2014-02-27 2014-02-27 语音操控方法及装置 Pending CN103853463A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410068778.6A CN103853463A (zh) 2014-02-27 2014-02-27 语音操控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410068778.6A CN103853463A (zh) 2014-02-27 2014-02-27 语音操控方法及装置

Publications (1)

Publication Number Publication Date
CN103853463A true CN103853463A (zh) 2014-06-11

Family

ID=50861186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410068778.6A Pending CN103853463A (zh) 2014-02-27 2014-02-27 语音操控方法及装置

Country Status (1)

Country Link
CN (1) CN103853463A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104599669A (zh) * 2014-12-31 2015-05-06 乐视致新电子科技(天津)有限公司 一种语音控制方法和装置
CN105631041A (zh) * 2016-01-25 2016-06-01 天脉聚源(北京)传媒科技有限公司 一种视频识别方法及装置
CN108600779A (zh) * 2018-05-18 2018-09-28 紫光华山信息技术有限公司 一种基于视频内容的目标对象操作方法及装置
CN112836226A (zh) * 2021-02-07 2021-05-25 重庆满集网络科技有限公司 用于外勤业务员的任务管理系统及方法

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079907A (zh) * 2006-05-26 2007-11-28 鸿富锦精密工业(深圳)有限公司 移动设备显示装置及其显示方法
CN101276586A (zh) * 2007-03-26 2008-10-01 京达国际科技股份有限公司 语音控制装置及方法
CN101303633A (zh) * 2007-05-09 2008-11-12 宏达国际电子股份有限公司 可执行指令的电子装置以及在电子装置上执行指令的方法
CN101377783A (zh) * 2007-08-27 2009-03-04 三星电子株式会社 用于显示缩略图的设备和方法
CN101382869A (zh) * 2007-09-06 2009-03-11 三星电子株式会社 使用触摸屏输入韩文字符的方法和设备
CN101382848A (zh) * 2007-09-04 2009-03-11 达方电子股份有限公司 具有加速窗口卷动功能的鼠标装置及其方法
CN101478648A (zh) * 2008-10-17 2009-07-08 康佳集团股份有限公司 一种电视机语音控制方法
CN102141788A (zh) * 2011-01-26 2011-08-03 深圳桑菲消费通信有限公司 一种监测环境变量的方法及系统
CN102833582A (zh) * 2012-08-02 2012-12-19 四川长虹电器股份有限公司 采用语音搜索音视频资源的方法
CN102867378A (zh) * 2012-08-28 2013-01-09 华南理工大学 一种门铃系统及其控制方法
US20130080177A1 (en) * 2011-09-28 2013-03-28 Lik Harry Chen Speech recognition repair using contextual information
CN103024471A (zh) * 2012-12-07 2013-04-03 康佳集团股份有限公司 一种用于智能云电视的快捷推荐方法
CN103167127A (zh) * 2012-08-07 2013-06-19 深圳市金立通信设备有限公司 基于距离传感器和手势操作实现手机来电静音的系统及方法
CN103268715A (zh) * 2013-05-21 2013-08-28 姚黎 互动教学辅导系统及方法
CN103353974A (zh) * 2013-08-03 2013-10-16 甘木林 一种保险理赔系统及其方法
CN103413442A (zh) * 2013-07-30 2013-11-27 刘伟 基于通视距离监测的高速公路团雾预警系统及预警方法
CN103581726A (zh) * 2013-10-16 2014-02-12 四川长虹电器股份有限公司 一种电视设备上采用语音实现游戏控制的方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079907A (zh) * 2006-05-26 2007-11-28 鸿富锦精密工业(深圳)有限公司 移动设备显示装置及其显示方法
CN101276586A (zh) * 2007-03-26 2008-10-01 京达国际科技股份有限公司 语音控制装置及方法
CN101303633A (zh) * 2007-05-09 2008-11-12 宏达国际电子股份有限公司 可执行指令的电子装置以及在电子装置上执行指令的方法
CN101377783A (zh) * 2007-08-27 2009-03-04 三星电子株式会社 用于显示缩略图的设备和方法
CN101382848A (zh) * 2007-09-04 2009-03-11 达方电子股份有限公司 具有加速窗口卷动功能的鼠标装置及其方法
CN101382869A (zh) * 2007-09-06 2009-03-11 三星电子株式会社 使用触摸屏输入韩文字符的方法和设备
CN101478648A (zh) * 2008-10-17 2009-07-08 康佳集团股份有限公司 一种电视机语音控制方法
CN102141788A (zh) * 2011-01-26 2011-08-03 深圳桑菲消费通信有限公司 一种监测环境变量的方法及系统
US20130080177A1 (en) * 2011-09-28 2013-03-28 Lik Harry Chen Speech recognition repair using contextual information
CN102833582A (zh) * 2012-08-02 2012-12-19 四川长虹电器股份有限公司 采用语音搜索音视频资源的方法
CN103167127A (zh) * 2012-08-07 2013-06-19 深圳市金立通信设备有限公司 基于距离传感器和手势操作实现手机来电静音的系统及方法
CN102867378A (zh) * 2012-08-28 2013-01-09 华南理工大学 一种门铃系统及其控制方法
CN103024471A (zh) * 2012-12-07 2013-04-03 康佳集团股份有限公司 一种用于智能云电视的快捷推荐方法
CN103268715A (zh) * 2013-05-21 2013-08-28 姚黎 互动教学辅导系统及方法
CN103413442A (zh) * 2013-07-30 2013-11-27 刘伟 基于通视距离监测的高速公路团雾预警系统及预警方法
CN103353974A (zh) * 2013-08-03 2013-10-16 甘木林 一种保险理赔系统及其方法
CN103581726A (zh) * 2013-10-16 2014-02-12 四川长虹电器股份有限公司 一种电视设备上采用语音实现游戏控制的方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104599669A (zh) * 2014-12-31 2015-05-06 乐视致新电子科技(天津)有限公司 一种语音控制方法和装置
CN105631041A (zh) * 2016-01-25 2016-06-01 天脉聚源(北京)传媒科技有限公司 一种视频识别方法及装置
CN108600779A (zh) * 2018-05-18 2018-09-28 紫光华山信息技术有限公司 一种基于视频内容的目标对象操作方法及装置
CN108600779B (zh) * 2018-05-18 2021-04-06 新华三信息技术有限公司 一种基于视频内容的目标对象操作方法及装置
CN112836226A (zh) * 2021-02-07 2021-05-25 重庆满集网络科技有限公司 用于外勤业务员的任务管理系统及方法

Similar Documents

Publication Publication Date Title
US10866785B2 (en) Equal access to speech and touch input
US10860345B2 (en) System for user sentiment tracking
US10143924B2 (en) Enhancing user experience by presenting past application usage
US9977584B2 (en) Navigating media playback using scrollable text
CN110090444B (zh) 游戏中行为记录创建方法、装置、存储介质及电子设备
CN110225387A (zh) 一种信息搜索方法、装置及电子设备
CN101295313B (zh) 显示控制设备和显示控制方法
CN106971723A (zh) 语音处理方法和装置、用于语音处理的装置
CN106648535A (zh) 直播客户端语音输入方法及终端设备
CN106297801A (zh) 语音处理方法及装置
US20150058007A1 (en) Method for modifying text data corresponding to voice data and electronic device for the same
CN104811812A (zh) 音视频播放进度的控制方法、装置、和系统
CN105915831A (zh) 声音记录装置以及声音记录方法
CN104756484A (zh) 信息处理设备、重放状态控制方法及程序
US11355158B2 (en) Asynchronous video collaboration
CN111541938A (zh) 视频生成方法、装置及电子设备
CN104267922A (zh) 一种信息处理方法及电子设备
CN108256071B (zh) 录屏文件的生成方法、装置、终端及存储介质
CN103853463A (zh) 语音操控方法及装置
US11813538B2 (en) Videogame telemetry data and game asset tracker for session recordings
CN103886777B (zh) 动画播放装置及方法、动画播放控制装置及方法
CN112311658A (zh) 语音信息处理方法、装置及电子设备
CN109545223A (zh) 应用于用户终端的语音识别方法及终端设备
US10347299B2 (en) Method to automate media stream curation utilizing speech and non-speech audio cue analysis
US8769169B2 (en) Assistive buffer usage techniques

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140611