CN107710148B - 一种语音控制的处理方法和装置 - Google Patents

一种语音控制的处理方法和装置 Download PDF

Info

Publication number
CN107710148B
CN107710148B CN201580027959.7A CN201580027959A CN107710148B CN 107710148 B CN107710148 B CN 107710148B CN 201580027959 A CN201580027959 A CN 201580027959A CN 107710148 B CN107710148 B CN 107710148B
Authority
CN
China
Prior art keywords
terminal
data service
application
voice
voice command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580027959.7A
Other languages
English (en)
Other versions
CN107710148A (zh
Inventor
王雅辉
郜文美
李小娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN107710148A publication Critical patent/CN107710148A/zh
Application granted granted Critical
Publication of CN107710148B publication Critical patent/CN107710148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/285Memory allocation or algorithm optimisation to reduce hardware requirements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3209Monitoring remote activity, e.g. over telephone lines or network connections
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/75Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 for modelling vocal tract parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种语音控制的处理方法和装置。该方法包括:处于关闭数据业务状态的终端通过第一应用接收语音指令之后,所述终端开启数据业务(602);所述第一应用为所述终端中用于语音控制的应用程序;所述终端禁止所述终端中所述第一应用以外的其它应用使用所述数据业务(604);在所述终端开启所述数据业务之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令(610)。终端在处于关闭数据业务状态时接收到语音指令(601),然后终端开启数据业务并禁止其它应用使用数据业务(602,604),能够方便的使用语音控制,并能够很好的控制数据流量的使用情况。

Description

一种语音控制的处理方法和装置
技术领域
本发明实施例涉及语音控制技术,尤其涉及一种语音控制的处理方法和装置。
背景技术
随着语音识别技术的发展,现有的终端普遍具有语音控制功能。一般通过终端中的语音助手来实现语音控制功能,用户通过语音助手可以对终端进行语音控制。例如:iPhone 4S及以上版本的苹果手机中的Siri即为语音助手。用户打开Siri之后,可以通过语音对手机进行控制。又例如:其它手机也普遍具有语音助手的功能。
语音助手一般需要在终端开启数据业务的情况下使用,即语音助手一般需要在线使用。也有一些语音助手具有离线功能,即在终端关闭数据业务时,能够通过语音助手进行一些手机内部的操作。例如:在终端关闭数据业务时,只能通过语音助手进行如下一些操作:打电话给某人,发短信给某人,打开计算器,修改手机铃声等等。在终端关闭数据业务时,如果一些操作指令需要联网才能完成,那么语音助手无法识别或无法执行这些操作指令的。例如:在终端关闭数据业务时,如果用户说“今天天气怎么样”,语音助手无法识别或无法执行该语音指令;此时语音助手会反馈:终端未开启数据业务,只支持特定的一些语音指令(这些特定的语音指令可以被显示在终端的显示界面上),或者语音助手会反馈无法使用语音助手。如果用户想继续使用,则用户需要手动打开终端的数据业务连接,由此造成操作过程复杂。
发明内容
本发明实施例提供了一种语音控制的处理方法和装置,使得关闭数据业务的终端在收到语音指令时,能够比较便利的执行该语音指令。
第一方面,本发明实施例提供一种语音控制的处理方法,包括:处于关闭数据业务状态的终端通过第一应用接收语音指令之后,所述终端开启数据业务;所述第一应用为所述终端中用于语音控制的应用程序;所述终端禁止所述终端中所述第一应用以外的其它应用使用所述数据业务;在所述终端开启所述数据业务之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。终端在处于关闭数据业务状态时接收到语音指令,然后终端开启数据业务并禁止其它应用使用数据业务,能够方便的使用语音控制,并能够很好的控制数据流量的使用情况。
可选的,所述终端开启数据业务包括:所述终端自动开启数据业务。终端自动开启数据业务,可以省去用户手动操作。
可选的,所述终端开启数据业务包括:所述终端获取执行所述语音指令所需的数据流量;若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)大于或等于第二预设阈值,则所述终端自动开启数据业务;若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)小于所述第二预设阈值,则所述终端发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,所述终端开启数据业务。终端根据执行所述语音指令所需的数据流量的大小来判断是否开启数据业务,在所需数据流量较小时,终端自动开启数据业务,在所需数据流量较大时,经过用户的确认之后再开启数据业务;使得终端在方便用户使用语音控制功能的同时,又对数据流量的使用进行控制。
可选的,所述终端开启数据业务包括:所述终端获取所述语音指令对应的业务类型;若所述业务类型为被允许开启数据业务的类型,则所述终端自动开启数据业务;若所述业务类型不是被允许开启数据业务的类型,则所述终端发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,所述终端开启数据业务。终端根据所述语音指令对应的业务类型来判断是否开启数据业务;使得终端可以基于预先的设置,方便用户通过语音控制功能使用某些类型的应用。
可选的,所述在所述终端开启所述数据业务之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令,具体包括:在所述终端开启所述数据业务之后,所述终端通过所述数据业务获取执行所述语音指令所需的数据流量;若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)大于或等于第二预设阈值,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)小于所述第二预设阈值,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。在开启数据业务之后,终端还可以基于可能要使用的数据流量来决定是否执行该语音指令。进一步对数据流量的使用进行控制。
可选的,所述在所述终端开启所述数据业务之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令,具体包括:在所述终端开启所述数据业务之后,所述终端获取所述语音指令对应的业务类型;若所述业务类型为被允许开启数据业务的类型,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;若所述业务类型不是被允许开启数据业务的类型,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。在开启数据业务之后,终端还可以基于语音指令对应的业务类型来判断是否执行该语音指令;使得终端可以基于预先的设置,方便用户通过语音控制功能使用某些类型的应用。
可选的,在所述处于关闭数据业务状态的终端通过第一应用接收语音指令之后,所述方法还包括:所述终端存储所述语音指令。终端可以先缓存该语音指令,在终端开启数据业务之后,无需再从用户接收语音指令,而是可以直接将该语音指令发送到网络侧,简化了操作。
可选的,所述方法还包括:在所述终端开启所述数据业务之前,所述终端对所述语音指令进行声纹识别;若所述语音指令的声纹被识别为所述终端的用户的声纹,则执行所述终端开启所述数据业务的步骤。
可选的,在所述终端控制所述第一应用通过所述数据业务执行所述语音指令之后,所述方法还包括:在预定时间段之后,所述终端关闭所述数据业务。
可选的,所述方法还包括:在所述处于关闭数据业务状态的终端通过第一应用接收语音指令之前,所述终端打开所述第一应用;在所述终端打开所述第一应用时,在所述终端接收所述语音指令时,在所述终端开启数据业务时,在所述第一应用通过所述数据业务执行所述语音指令时,所述终端均处于熄屏状态。终端在执行语音指令的过程中,均处于熄屏状态,可以节省功耗。
可选的,所述方法还包括:在所述处于关闭数据业务状态的终端通过第一应用接收语音指令之前,所述终端打开所述第一应用;其中,在所述终端打开所述第一应用时,所述终端处于熄屏状态;在所述终端控制所述第一应用通过所述数据业务执行所述语音指令的过程中,若所述终端能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于熄屏状态,若所述终端不能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于亮屏状态。
第二方面,本发明实施例提供一种语音控制的处理方法,包括:处于关闭数据业务状态的终端接收开启第一应用的指示,所述第一应用为所述终端中用于语音控制的应用程序;在所述终端接收到所述开启第一应用的指示之后,所述终端开启数据业务;在所述终端接收到所述开启第一应用的指示之后,所述终端开启所述第一应用;所述终端禁止所述终端中所述第一应用以外的其它应用使用所述数据业务。终端在处于关闭数据业务状态时若接收到开启第一应用的指示,则终端自动开启数据业务,并禁止其它应用使用数据业务,能够方便的使用语音控制,并能够很好的控制数据流量的使用情况。
可选的,所述方法还包括:在所述终端开启所述第一应用之后,所述终端通过所述第一应用接收语音指令;所述终端获取执行所述语音指令所需的数据流量;若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)大于或等于第二预设阈值,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)小于所述第二预设阈值,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。在开启数据业务之后,终端还可以基于可能要使用的数据流量来决定是否执行该语音指令。进一步对数据流量的使用进行控制。
可选的,所述方法还包括:在所述终端开启所述第一应用之后,所述终端通过所述第一应用接收语音指令;所述终端获取所述语音指令对应的业务类型;若所述业务类型为被允许开启数据业务的类型,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;若所述业务类型不是被允许开启数据业务的类型,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。在开启数据业务之后,终端还可以基于语音指令对应的业务类型来判断是否执行该语音指令;使得终端可以基于预先的设置,方便用户通过语音控制功能使用某些类型的应用。
第三方面,本发明实施例提供一种语音控制的处理方法,包括:处于关闭数据业务状态的终端通过第一应用接收语音指令之后,所述终端开启数据业务,所述第一应用为所述终端中用于语音控制的应用程序,所述语音指令包括使用所述终端中的至少一个第二应用的指令;所述终端禁止所述终端中除所述第一应用和至少一个所述第二应用以外的其它应用使用所述数据业务;在所述终端开启所述数据业务之后,所述终端控制所述第二应用使用所述数据业务。终端在处于关闭数据业务状态时接收到语音指令,当该语音指令用于指示使用第二应用时,终端开启数据业务,允许第二应用使用数据业务,并禁止其它应用使用数据业务,能够方便的使用语音控制,并能够很好的控制数据流量的使用情况。
可选的,所述方法还包括:所述终端还禁止所述第一应用使用所述数据业务。进一步的,终端还可以禁止第一应用使用数据业务,即只允许第二应用使用数据业务。
第四方面,本发明实施例提供一种语音控制处理装置,包含在终端中,该语音控制处理装置具有实现上述第一方面各方法中终端行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
第五方面,本发明实施例提供一种语音控制处理装置,包含在终端中,该语音控制处理装置具有实现上述第二方面各方法中终端行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
第六方面,本发明实施例提供一种语音控制处理装置,包含在终端中,该语音控制处理装置具有实现上述第三方面各方法中终端行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
本发明实施例还提供了一种计算机存储介质,用于储存为上述任一方面中终端所用的计算机软件指令,其包含用于执行上述方面所设计的程序。
终端在处于关闭数据业务状态时接收到语音指令,然后终端开启数据业务并禁止其它应用使用数据业务,能够方便的使用语音控制,并能够很好的控制数据流量的使用情况。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音控制的处理方法的流程示意图;
图2A-2C为本发明实施例提供的另一种语音控制的处理方法的流程示意图;
图2D为本发明实施例提供的一种终端从网络侧获取执行语音指令所需的数据流量的方法的示意图;
图3为本发明实施例提供的另一种语音控制的处理方法的流程示意图;
图4为本发明实施例提供的另一种语音控制的处理方法的流程示意图;
图5为本发明实施例提供的另一种语音控制的处理方法的流程示意图;
图6为本发明实施例提供的另一种语音控制的处理方法的流程示意图;
图7为本发明实施例提供的另一种语音控制的处理方法的流程示意图;
图8为本发明实施例提供的一种终端的示意图;
图9为本发明实施例提供的一种语音控制处理装置的示意图;
图10为本发明实施例提供的另一种语音控制处理装置的示意图;
图11为本发明实施例提供的另一种语音控制处理装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明各实施例提供的语音控制的处理方法应用于终端。该终端可以与外部网络进行数据业务的交互。该终端例如可以为:移动电话、平板电脑(Tablet PersonalComputer)、膝上型电脑(Laptop Computer)、个人数字助理(personal digitalassistant,简称PDA)、机顶盒、导航装置、移动上网装置(Mobile Internet Device,MID)或可穿戴式设备(Wearable Device)等。
本发明各实施例中的终端可以开启数据业务,也可以关闭数据业务。其中,开启数据业务相当于启动(enabled)数据业务,关闭数据业务相当于停用(disabled)数据业务。当终端处于开启数据业务的状态时,终端能够与外部网络进行数据业务的交互,即此时终端可以上网;当终端处于关闭数据业务的状态时,终端不能与外部网络进行数据业务的交互,即此时终端不能上网。本发明各实施例中的数据业务主要是指移动数据业务,例如:通用分组无线业务(general packet radio service,GPRS)、GSM演进增强数据速率(EnhancedData rates for GSM Evolution,EDGE)、时分-同步码分多址(Time Division-Synchronous Code Division Multiple Access,TD-SCDMA)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、码分多址(Code Division Multiple Access,CDMA)、高速下行链路分组接入(High Speed Downlink Packet Access,HSDPA)、长期演进(Long Term Evolution,LTE)等移动通信技术提供的上网业务;或者,还可以是无线局域网(wireless local area network,WLAN)提供的上网业务。
本发明各实施例中的终端可以包括多个应用程序(Application,简称App),用来实现不同的功能。例如社交类的App、游戏类的App和购物类的App等等。
图1为本发明实施例提供的一种语音控制的处理方法的流程示意图。如图1所示,所述方法包括:
步骤101、处于关闭数据业务状态的终端通过第一应用接收语音指令之后,该终端开启数据业务。其中,第一应用为终端中用于语音控制的应用程序。
本发明各实施例中所述的第一应用为语音助手或类似的App,例如:iPhone中的语音助手(Siri)。当语音助手打开之后,用户可以通过语音控制终端。其中,可以通过用户手动操作打开语音助手;或者,也可以通过语音打开语音助手,例如:具有黑屏唤醒功能的手机,在处于休眠状态时,手机中的语音助手可以被特定的语音唤醒词打开,比如“HeySiri”、“OK Google”等。在语音助手被打开之后,可以接收用户发出的语音。或者,语音助手也可以在被打开的同时接收用户发出的语音指令,例如:当用户可以连着唤醒词一起提出问话时,比如“Hey Siri,明天天气如何?”,Siri被唤醒时,也收到了语音指令“明天天气如何?”。需要说明的是,本发明各实施例中的语音指令指的是指示语音助手操作的指令,并不包括前述的语音唤醒词。例如“Hey Siri”、“OK Google”等语音唤醒词是用于唤醒语音助手的,并不属于本发明各实施例中的语音指令。
本发明实施例提供的方法,主要应用于终端在处于关闭数据业务状态下接收到语音指令的情况。
终端处于数据业务被关闭的状态,在第一应用被打开(即被激活)之后,终端可以通过第一应用接收用户发出的语音指令;在接收到语音指令后,终端可以开启数据业务。
终端在开启数据业务时,可以有多种情况。例如:终端可以直接自动开启数据业务;或者,终端可以先获取执行该语音指令所需的数据流量,当所需的数据流量低于预设值时,才开启数据业务,否则不开启数据业务;或者,终端可以获取该语音指令对应的业务类型,当业务类型为被允许开启数据业务的类型时,终端自动开启数据业务,否则,终端在接收到开启数据业务的指示之后才开启数据业务;或者,终端获取该语音指令的声纹信息,当判断出该声纹信息属于终端的拥有者时,才开启数据业务或者判断数据流量之后开启数据业务。
需要说明的是,在处于关闭数据业务状态的终端接收到语音指令后,终端可以先判断当前能否执行该语音指令,即终端先判断执行该语音指令是否需要与外部网络进行数据业务的交互,当执行该语音指令需要与外部网络进行数据业务的交互,则终端可以开启数据业务。
其中,终端可以先判断自身是否处于关闭数据业务的状态;如果终端处于关闭数据业务的状态,则终端再判断接收到的语音指令是否需要使用数据业务才能执行;如果接收到的语音指令需要使用数据业务才能执行,则终端可以开启数据业务。或者,终端可以先判断接收到的语音指令是否需要使用数据业务才能执行;如果接收到的语音指令需要使用数据业务才能执行,终端再判断自身是否处于关闭数据业务的状态;如果终端处于关闭数据业务的状态,则终端可以开启数据业务。本实施例并不限定终端判断自身是否处于关闭数据业务的状态和判断接收到的语音指令是否需要使用数据业务才能执行这两个动作的执行顺序。
若关闭数据业务的终端无法识别该语音指令,则终端获知该语音指令需要使用数据业务才能执行。或者,终端中预先存储了哪些控制指令需要使用数据业务,哪些控制指令不需要数据业务;然后终端可以判断出该语音指令是否需要使用数据业务才能执行。例如:终端接收到语音“明天的天气如何?”;终端可能无法识别该语音,则终端可以开启数据业务;或者,终端识别出执行该语音对应的操作需要开启数据业务。
需要说明的是,在收到语音指令后,如果终端判断可以执行该语音指令(即执行该语音指令不需要与外部网络进行数据业务的交互时),则终端可以直接执行该语音指令。例如:当终端收到语音“打开蓝牙”,则终端直接执行打开蓝牙的操作。
步骤102、终端禁止终端中第一应用以外的其它应用使用数据业务。
一方面,终端开启数据业务,以供第一应用可以使用数据业务;另一方面,终端禁止其它应用使用数据业务。所述的其它应用指的是终端中安装的、除了第一应用以外的应用。
由于终端上的一些应用会在后台自动使用数据业务,所以当用户想控制数据流量的使用时,可能会断开终端的数据业务;为了保证其它应用不随意使用数据业务,又能保证语音助手的联网,终端在开启数据业务之后,可以禁止其它应用使用数据业务。
本实施例并不限定步骤101和步骤102的执行顺序。即可以在开启数据业务之前或之后执行步骤102,或者这两个步骤同时执行,或者这两个步骤可以通过一个动作或一个步骤来实现。
终端可以通过多种方式禁止其它应用使用数据业务。例如:方式一、终端关闭其它应用的数据开关;具体的,终端可以在系统设置的联网应用控制选项中禁用掉所有其它的应用,只打开语音助手应用,也就是说只让语音助手使用数据流量,其他应用还是处于不连网的状态。实际上,禁止应用使用移动网络,相当于取消了该应用的移动数据上网权限(Permission)。以Android系统为例,在Android框架内详细的划分了各种对象(包括设备上的各类数据、传感器、拨打电话、发送信息、控制别的应用程序等)的访问权限,列出了一系列″Android.Permission.*″对象。应用程序在运行前会向Android系统声明它将会用到的权限。方法二、终端只为语音助手应用分配用于上网的端口号;具体的,在启动语音助手进程之后,可以只为语音助手这个进程ID分配一对TCP(Transmission Control Protocol,传输控制协议)/UDP(User Datagram Protocol,用户数据报协议)的端口号,然后仅允许这对端口号进行数据业务的收发,也就是仅为语音助手开启网络。
步骤103、在终端开启数据业务之后,终端控制第一应用通过数据业务执行该语音指令。
在开启数据业务之后,终端控制第一应用执行所述语音指令。终端的第一应用通过数据业务将该语音指令发送到网络侧,然后接收网络侧返回的响应,并将该响应反馈给用户。例如:用户发出的语音指令为“明天天气怎么样?”,第一应用获取该语音指令之后,通过数据业务向网络侧请求明天的天气,然后第一应用接收到网络侧返回的今天的天气情况,最后终端通过文字或语音或图片等形式显示明天的天气情况,以将天气情况提供给用户。
可选的,在一种具体实施方式中,上述方法还可以包括以下步骤:
步骤101’、处于关闭数据业务状态的终端通过第一应用接收语音指令之后,终端存储该语音指令。
处于关闭数据业务状态的终端接收到语音指令后,如果终端判断当前无法执行该语音指令(即执行该语音指令需要与外部网络进行数据业务的交互),则终端存储该语音指令。
本实施例并不限定终端判断自身是否处于关闭数据业务的状态和判断接收到的语音指令是否需要使用数据业务才能执行这两个动作的执行顺序。当终端获知自身处于关闭数据业务的状态,且接收到的语音指令需要使用数据业务才能执行,则终端存储该语音指令。
本实施例也不限定步骤101和步骤101’的执行顺序。即在处于关闭数据业务状态的终端通过第一应用接收语音指令之后,终端可以先开启数据业务,也可以先存储该语音指令。
需要说明的是,在收到语音指令后,如果终端判断可以执行该语音指令(即执行该语音指令不需要与外部网络进行数据业务的交互时),则终端可以直接执行该语音指令,而无需对该语音指令进行缓存。例如:当终端收到语音“打开蓝牙”时,终端可以直接执行打开蓝牙的操作,而无需缓存该语音指令。
本发明实施例,处于关闭数据业务状态的终端通过第一应用接收语音指令之后,终端开启数据业务;在开启数据业务之后,终端中的第一应用可以通过数据业务执行该语音指令,并且终端还禁止除第一应用以外的其它应用使用数据业务。终端在处于关闭数据业务状态时接收到语音指令,然后终端开启数据业务并禁止其它应用使用数据业务,能够方便的使用语音控制,并能够很好的控制数据流量的使用情况。
图2A-2C为本发明实施例提供的另一种语音控制的处理方法的流程示意图。如图2A-2C所示,在图1所示实施例的基础上,所述方法包括:
步骤201、处于关闭数据业务状态的终端通过第一应用接收语音指令。该步骤的描述可以参见图1所示实施例步骤101中的描述。
步骤202、终端存储该语音指令。
其中,终端可以先判断自身是否处于关闭数据业务的状态;如果终端处于关闭数据业务的状态,则终端再判断接收到的语音指令是否需要使用数据业务才能执行;如果接收到的语音指令需要使用数据业务才能执行,则终端对该语音指令进行存储。或者,终端可以先判断接收到的语音指令是否需要使用数据业务才能执行;如果接收到的语音指令需要使用数据业务才能执行,终端再判断自身是否处于关闭数据业务的状态;如果终端处于关闭数据业务的状态,则终端可以存储该语音指令。终端可以先缓存该语音指令,在终端开启数据业务之后,无需再从用户接收语音指令,而是可以直接将该语音指令发送到网络侧,简化了操作。
在步骤202之后,还可以包括声纹识别的步骤,即步骤203。
步骤203、终端该述语音指令进行声纹识别。若该语音指令的声纹被识别为终端的用户的声纹,则执行步骤204a或步骤204b或步骤204c。若该语音指令的声纹被识别为不是终端的用户的声纹,即当前使用终端的用户不是终端的主人,则可以执行步骤211。
终端的第一应用接收到语音指令之后,即第一应用获取到用户发出的语音之后,终端对该语音指令进行声纹识别。通过增加声纹识别,可以禁止别的用户(非终端主人)随意使用语音控制功能。
终端可以预先存储用户的声纹信息。在处于关闭数据业务的状态下,当终端接收到语音指令时,终端可以先获取该语音指令对应的声纹信息,然后将获取的声纹信息与预先存储的声纹信息进行匹配;如果一致,则识别出获取的声纹信息为该终端的用户的声纹信息;如果不一致,则识别出获取的声纹信息不是该终端的用户的声纹信息。若识别出该语音指令的声纹信息为该终端的用户的声纹信息,则执行步骤204a或步骤204b或步骤204c。
其中,终端可以先判断自身是否处于关闭数据业务的状态;如果终端处于关闭数据业务的状态,则终端再判断接收到的语音指令是否需要使用数据业务才能执行;如果接收到的语音指令需要使用数据业务才能执行,则终端对该语音指令进行声纹识别。或者,终端可以先判断接收到的语音指令是否需要使用数据业务才能执行;如果接收到的语音指令需要使用数据业务才能执行,终端再判断自身是否处于关闭数据业务的状态;如果终端处于关闭数据业务的状态,则终端对该语音指令进行声纹识别。
步骤211、终端对用户的身份进行验证。若验证通过之后,再执行步骤204a或204b或步骤204c;若验证不通过,则终止。
其中,终端对用户的身份验证的方式可以有多种。例如:方式一、终端提示“是否打开数据开关”,如果终端接收到终端的主人(通过声纹识别)回复确认打开或者终端接收到与预先设置的密码相同的密码,则验证通过。方式二、终端提示“是否继续执行语音助手”,如果终端接收到终端的主人(通过声纹识别)回复确认继续执行或者终端接收到与预先设置的密码相同的密码,则验证通过。
本实施例中,以步骤203在步骤202之后执行为例进行说明。然而,本实施例并不限定步骤202和步骤203的先后顺序,步骤203可以在步骤202之前执行,或者,步骤202和步骤203可以并行执行。在步骤203执行完毕之后,根据识别结果执行步骤204a或步骤204b或步骤204c。
在步骤203之后,终端可以自动开启数据业务,也可以获取执行该语音指令所需的数据流量,然后根据所需的数据流量确定是否开启数据业务,还可以获取该语音指令对应的业务类型,然后根据业务类型确定是否开启数据业务。下面通过图2A中的步骤204a-步骤209a来描述终端自动开启数据业务的方案,通过图2B中的步骤204b-步骤209b来描述根据流量开启数据业务的方案,通过图2C中的步骤204c-步骤209c来描述根据业务类型开启数据业务的方案。
如图2A所示,在步骤203确定该语音指令的声纹为终端的用户的声纹之后,执行步骤204a。
步骤204a、终端自动开启数据业务,并禁止第一应用以外的其它应用使用数据业务。
终端可以通过打开数据开关来开启数据业务。终端自动开启数据业务,可以省去用户手动操作。终端禁止第一应用以外的其它应用使用数据业务的过程参见上述步骤102中的描述。
在开启数据业务之后,终端可以执行该语音指令,即终端执行步骤209a;或者,在开启数据业务之后,终端可以根据执行该语音指令所需的数据流量来确定是否执行该语音指令,即终端可以执行步骤205a,或者,在开启数据业务之后,终端可以根据该语音指令对应的业务类型来确定是否执行该语音指令,即终端可以执行步骤205a’。
步骤205a、终端通过数据业务获取执行该语音指令所需的数据流量。
在开启数据业务之后,终端可以向网络侧的服务器发送请求,请求获取执行该语音指令所需的数据流量。服务器接收到请求之后,可以根据服务器本地存储的信息,查询执行该语音指令所需的数据流量,然后将查询结果返回给终端;或者,服务器在接收到请求之后,可以预加载该语音指令对应的内容,统计出执行该语音指令所需的数据流量,然后将统计的结果返回给终端。具体的,终端从网络侧获取执行语音指令所需的数据流量的过程可以参见下述图2B中的描述。
其中,本发明各实施例中所述的所需的数据流量可以是确切的所需要使用的数据流量,也可以是个估计值。所需的数据流量可以根据历史值估算得到,也可以是预设的估计值,还可以由网络侧实际测量得到。
步骤206a、终端判断所需的数据流量的大小,若所需的数据流量较小,则执行步骤209a,若所需的数据流量较大,则执行步骤207a;具体的:终端将所需的数据流量与预设的阈值进行比较,或者终端将剩余流量与所需的数据流量进行比较;当所需的数据流量小于或等于第一预设阈值时,或者当终端的剩余流量与所需的数据流量的差值(或比值)大于或等于第二预设阈值时,执行步骤209a;当所需的数据流量大于第一预设阈值时,或者当终端的剩余流量与所需的数据流量的差值(或比值)小于第二预设阈值时,执行步骤207a。
终端可以预先设定一个阈值(第一预设阈值);当执行语音指令所需的数据流量比较小时(小于或等于该第一预设阈值),可以执行该语音指令;当执行语音指令所需的数据流量比较大时(大于该第一预设阈值),终端可以放弃执行该语音指令,或者可以向用户提出请求,在请求被允许后,终端再执行该语音指令(见步骤207a、步骤208a)。
一般用户在使用终端时,对数据流量采用包月的方式,即一个月内或一段时间内有一定数据流量(称为总流量)可以使用,例如:一个月内有1G的数据流量。总流量减去已使用的数据流量,得到剩余流量。终端可以预先设定另一个阈值(第二预设阈值),当剩余流量与执行语音指令所需的数据流量的差值(或比值)大于或等于该第二预设阈值时,可以执行该语音指令,或者,当剩余流量与执行语音指令所需的数据流量的比值大于或等于该第二预设阈值时,可以执行该语音指令。
步骤207a、终端发出是否执行该语音指令的提示。
终端可以采取多种方式发出提示,比如通过语音播报或者在显示屏上弹出文字告知用户当前所需的流量,并请求用户做出选择。当终端发出提示之后,用户可以选择是否执行该语音指令,并通过语音或者在显示屏上输入的方式将选择结果告知终端。
步骤208a、终端接收执行该语音指令的指示,然后执行步骤209a。
用户选择执行该语音指令之后,终端接收到指示,然后执行后续步骤。如果用户选择不执行该语音指令,则终端终止使用第一应用,即终止语音控制过程。
步骤209a、终端控制第一应用通过数据业务执行该语音指令。
需要说明的是,如果在步骤205a中,终端已经将语音指令发送给服务器,那么在步骤209a中,终端可以只通知服务器执行该语音指令,并接收服务器返回的信息即可;如果在步骤205a中,终端没有将语音指令发送给服务器,那么在步骤209a中,终端把该语音指令发送给服务器,并接收服务器返回的信息。
在开启数据业务之后,终端还可以基于可能要使用的数据流量来决定是否执行该语音指令。进一步对数据流量的使用进行控制。在另一实现方案中,上述步骤205a-步骤206a可以替换为以下步骤205a’-步骤206a’。
步骤205a’、终端获取该语音指令对应的业务类型。
不同的语音指令可以对应不同的业务类型。例如:从网上搜索图片的指令对应图片搜索的类型,翻译句子的指令对应翻译的类型。还有其它类型,例如:查询天气、地图导航等等。
步骤206a’、终端判断该语音指令对应的业务类型是否为被允许开启数据业务的类型,若是,则执行步骤209a,若否,则执行步骤207a。
在终端可以预先存储被允许开启数据业务的类型,也可以预先存储不被允许开启数据业务的类型。在获取语音指令对应的业务类型之后,终端可以根据预先存储的内容判断该语音指令是否被允许开启数据业务,如果被允许,则开启数据业务,即执行步骤209a,如果不被允许,则执行步骤207a。在设置哪些业务类型被允许开启数据业务,哪些业务类型不被允许开启数据业务时,可以有多种规则。例如:可以将可能使用较多数据流量的业务类型设置为不被允许开启数据业务,可以将可能使用较少数据流量的业务类型设置为被允许开启数据业务;或者,可以将优先级较低的业务类型设置为不被允许开启数据业务,可以将优先级较高的业务类型设置为被允许开启数据业务。终端可以根据预设的规则设置哪些业务类型被允许开启数据业务,或者终端在出厂前或出厂后被配置哪些业务类型被允许开启数据业务。
在开启数据业务之后,终端还可以基于语音指令对应的业务类型来判断是否执行该语音指令;使得终端可以基于预先的设置,方便用户通过语音控制功能使用某些类型的应用。
如图2B所示,在步骤203确定该语音指令的声纹为终端的用户的声纹之后,可以不执行步骤204a,而是可以执行以下步骤204b-步骤209b:
步骤204b、终端获取执行该语音指令所需的数据流量。
终端本地可以预先存储各种语音指令所需的数据流量,终端接收到语音指令之后,可以在终端本地查询该语音指令所需的数据流量。具体的,终端可以存储一个关系表,其中包括各种语音指令及其对应的数据流量。该关系表可以预先存储在终端中。或者,该关系表可以根据第一应用的使用历史生成;当终端通过数据业务执行语音指令时,将该语音指令所需的数据流量记录在关系表中,以供后续查询使用。
步骤205b、终端判断所需的数据流量的大小,若所需的数据流量较小,则执行步骤208b,即终端可以自动开启数据业务,若所需的数据流量较大,则执行步骤206b;具体的:终端将所需的数据流量与预设的阈值进行比较,或者终端将剩余流量与所需的数据流量进行比较;当所述所需的数据流量小于或等于第一预设阈值时,或者当所述终端的剩余流量与所述所需的数据流量的差值(或比值)大于或等于第二预设阈值时,执行步骤208b,即终端可以自动开启数据业务;当所需的数据流量大于第一预设阈值时,或者当终端的剩余流量与所需的数据流量的差值(或比值)小于第二预设阈值时,执行步骤206b。
具体的,终端将所需的数据流量与阈值进行比较的过程,或者终端将剩余流量与所需的数据流量进行比较的过程,均可参见上述步骤206a中的描述。
步骤206b、终端发出是否开启数据业务的提示。
终端可以采取多种方式发出提示,比如通过语音播报或者在显示屏上弹出文字告知用户当前所需的流量,并请求用户做出选择。当终端发出提示之后,用户可以选择是否开启数据业务,并通过语音或者在显示屏上输入的方式将选择结果告知终端。
步骤207b、终端接收开启数据业务的指示,然后执行步骤208b。
用户选择开启数据业务之后,终端接收到指示,然后执行后续步骤。如果用户选择不开启数据业务,则终端终止使用第一应用,即终止语音控制过程。
步骤208b、终端开启数据业务,并禁止第一应用以外的其它应用使用数据业务。
终端可以通过打开数据开关来开启数据业务。终端禁止第一应用以外的其它应用使用数据业务的过程参见上述步骤102中的描述。
步骤209b、终端控制第一应用通过数据业务执行该语音指令。
终端的第一应用执行该语音指令,终端将该语音指令发送给网络侧的服务器,然后接收服务器返回的信息,并将返回的信息反馈给用户。
终端根据执行所述语音指令所需的数据流量的大小来判断是否开启数据业务,在所需数据流量较小时,终端自动开启数据业务,在所需数据流量较大时,经过用户的确认之后再开启数据业务;使得终端在方便用户使用语音控制功能的同时,又对数据流量的使用进行控制。
如图2C所示,在步骤203确定该语音指令的声纹为终端的用户的声纹之后,可以不执行步骤204a或步骤204b,而是可以执行以下步骤204c-步骤209c:
步骤204c、终端获取该语音指令对应的业务类型。
步骤205c、终端判断该语音指令对应的业务类型是否为被允许开启数据业务的类型,若是,则执行步骤208c,若否,则执行步骤206c。
具体的,步骤204c、步骤205c可以参见步骤205a’、步骤206a’中的描述。
步骤206c、终端发出是否开启数据业务的提示。
步骤207c、终端接收开启数据业务的指示,然后执行步骤208b。
步骤208c、终端开启数据业务,并禁止第一应用以外的其它应用使用数据业务。
步骤209c、终端控制第一应用通过数据业务执行该语音指令。
具体的,步骤206c-步骤209c可以参见步骤206b-步骤209b中的描述。
终端根据语音指令对应的业务类型来判断是否开启数据业务;使得终端可以基于预先的设置,方便用户通过语音控制功能使用某些类型的应用。
参见图2A或图2B或图2C,在步骤209a或者步骤209b或者步骤209c之后,还可以包括步骤210。
步骤210、在预定时间段之后,终端关闭数据业务。
终端在执行步骤209a或者步骤209b或者步骤209c之后,可以马上关闭数据业务,也可以在预设时间段之后再关闭数据业务。
在关闭数据业务之前,若终端再接收到语音指令,则仍然可以利用数据业务执行新接收到的语音指令。
可选的,在执行步骤209a或者步骤209b或者步骤209c之后,当终端再接收到语音指令时,若终端判断可以离线执行(即不需要数据业务)新接收的语音指令,则终端可以关闭数据业务,并离线执行该新接收的语音指令。
在断开(即关闭)数据业务之后,若终端再次收到语音指令,则可以重复执行上述步骤201-步骤211。
需要说明的是,在步骤201之前,终端可以先打开第一应用。
进一步的,为了降低终端的功耗,终端可以在执行上述步骤201-步骤211的过程中,均处于灭屏状态;即,终端在打开第一应用时,在接收语音指令时,在开启数据业务时,在使用第一应用通过数据业务执行语音指令时,终端均可以处于熄屏状态;数据网络只针对第一应用(语音助手)开端口,终端的其他模块不被唤醒。当终端均处于熄屏状态时,终端在接收到网络侧返回的执行结果之后,可以将执行结果通过语音播报的方式反馈给用户。比如:当终端接收到的语音指令为“明天天气怎么样?”,终端最终通过语音将明天的天气情况播放出来。
可选的,终端可以根据实际情况决定是否在熄屏的状态下执行上述步骤。例如:在打开第一应用时,或者,在接收语音指令时,或者在开启数据业务时,终端可以均处于熄屏状态;在终端控制第一应用通过数据业务执行语音指令的过程中,若终端判断能够通过语音响应该语音指令,则终端在执行该语音指令的过程中处于熄屏状态;若终端判断不能通过语音响应该语音指令,则终端在执行该语音指令的过程中点亮屏幕。例如:若终端接收到的语音指令为“明天天气怎么样?”,则终端可以通过语音将明天的天气情况播放出来,此时终端可以保持灭屏状态;若终端接收到的语音指令为“搜索从位置1到位置2的行车路线”,则终端点亮屏幕,并在屏幕上显示搜索出来的地图信息。
在实际处理过程中,当终端处于熄屏状态时,用户可以使用特定唤醒词启动语音助手(或者,语音助手通过随时监控语音,分析语义,自动启动来主动帮助用户),低功耗语音芯片处理用户语音请求,并不唤醒主处理器,也不点亮屏幕。若判断应答结果可以语音播报给用户,则仍然保持手机灭屏,语音播报应答结果,否则,唤醒主处理器,点亮屏幕,显示应答结果。
图2D为本发明实施例提供的一种终端从网络侧获取执行语音指令所需的数据流量的方法的示意图。该方法是终端获取数据流量的一种可选方式。该方法包括:
步骤21、终端打开语音助手后,接收语音任务。
其中,本实施例中的语音任务表示的是用户发出的语音;即终端打开语音助手之后,可以接收用户发出的语音。该语音任务相当于其它实施例中的语音指令。
步骤22、终端开启数据业务,并限制其它应用使用数据业务。
步骤23、终端将语音任务上传到云端服务器(网络侧服务器)。
云端服务器可以包括语音识别模块、语音任务处理模块和第三方内容模块;这三个模块可以独立设置或者集成为一个模块;这三个模块可以为软件组成的功能模块,也可以为硬件组成的实体。
步骤24、云端服务器的语音识别模块接收终端上传的语音任务,并识别该语音任务。
语音任务中包括用户的请求。例如:语音任务为“明天天气怎么样?”,其中的用户的请求为明天的天气情况。
步骤25、语音识别模块将识别出的语音任务发送给语音任务处理模块。
在步骤25之后,可以执行步骤26a或者步骤26b,然后执行步骤27。
步骤26a、语音任务处理模块在本地查询历史记录或者在本地查询预先存储的信息,得到该语音任务所需的数据流量。
在之前处理语音任务的过程中,语音任务处理模块可以记录执行某个语音任务所需的数据流量,比供后续查询。或者,可以在语音任务处理模块中预先存储各种语音任务及其对应的数据流量。
步骤26b、语音任务处理模块根据语音任务,预加载该语音任务对应的内容;具体的,语音任务处理模块从第三方内容模块中获取该语音任务对应的内容,然后统计该语音任务对应的数据流量。
上述步骤26a和步骤26b不是同时执行的,而是任选其一执行。
步骤27、语音任务处理模块将执行该语音任务所需的数据流量返回给终端。
步骤28、终端根据预设的规则和所需的数据流量判断是否执行该语音任务;若执行该语音任务,则执行步骤29a,若不执行该语音任务,则执行步骤29b。
具体的判断过程参见上述实施例中的描述。
步骤29a、终端通知语音任务处理模块执行该语音任务。
步骤30a、语音任务处理模块执行该语音任务,获取该语音任务对应的结果。其中,执行该语音任务的过程可以参见现有技术,语音任务处理模块可以调用各种终端内部和外部服务,来执行该语音任务。
步骤31a、语音任务处理模块将获取的结果返回给终端。
步骤29b、终端向用户请求是否执行该语音任务,若用户允许执行该语音任务,则执行步骤29a-步骤31a,若用户不允许,则退出语音助手;或者,终端直接退出语音助手。步骤29b在图中未示出。
图3为本发明实施例提供的另一种语音控制的处理方法的流程示意图。图3为上述各实施例提供的方法的一个具体例子,仅用于示例说明。如图3所示,所述方法包括:
步骤301、终端上的语音助手被唤醒,并接收到用户发出的语音任务。
用户可以通过预定的方式将语音助手应用唤醒。
步骤302、终端检查是否有数据网络连接;若有数据网络连接,则执行正常的处理流程;若没有数据网络连接,则执行步骤303。
其中,所述的数据网络相当于前述实施例中的数据业务。所述正常的处理流程,指的是与现有技术相同的处理流程。
步骤303、终端判断是否可以离线处理该语音任务;若可以离线处理,则执行正常的处理流程,即离线执行该语音任务;若不能离线处理,则执行步骤304。
需要说明的是,本实施例并不限定步骤302、步骤303的执行顺序。
步骤304、终端对该语音任务进行声纹识别,若识别出该语音任务是由终端的主人发出的,则执行步骤305,若识别出该语音任务不是由终端的主人发出的,则执行步骤311。
步骤305、终端缓存该语音任务,并打开数据开关,连接数据网络,禁止其它应用使用数据网络。
步骤306、终端通过数据网络,从服务器端获取执行该语音任务所需的数据流量F1。
步骤307、终端获取本终端的剩余流量F2,然后执行步骤308a或者308b。
步骤308a、终端判断数据流量F1是否小于预设阈值N1,若是,则执行步骤310,若否,则执行步骤309。
步骤308b、终端判断F2与F1的差值(或比值)是否大于预设阈值N2,若是,则执行步骤310,若否,则执行步骤309。
步骤309、终端将F1(或者F2,或者F1和F2)提示给用户,并请求用户确认是否继续执行,若接收到继续执行的指示,则执行步骤310,否则,终止。
在具体实现中,可以不包括步骤307,或者可以不包括步骤306,或者也可以同时包括步骤306和步骤307。当不包括步骤307时,在步骤306之后执行步骤308a。当不包括步骤306时,在步骤307之后,可以执行步骤308c(图中未示出);步骤308c为:终端判断F2是否大于预设阈值N3,若是,则执行步骤310,若否,则执行步骤309,在执行步骤309时,终端将F2提示给用户。
步骤310、终端从服务器获取该语音任务对应的响应,并反馈给用户,结束。
步骤311、终端缓存该语音任务。
步骤312、终端询问用户是否打开数据网络,若是,则执行步骤313,若否,则终止。
步骤313、终端打开数据网络,禁止其它应用使用数据网络,并从网络侧获取该语音任务对应的响应。
步骤314、终端将获取的响应反馈给用户,结束。
图4为本发明实施例提供的另一种语音控制的处理方法的流程示意图。图4为上述各实施例提供的方法的一个具体例子,仅用于示例说明。如图4所示,所述方法包括:
步骤401、终端上的语音助手被唤醒,并接收到用户发出的语音任务。
步骤402、终端判断是否可以离线处理该语音任务;若可以离线处理,则执行正常的处理流程,即离线执行该语音任务;若不能离线处理,则执行步骤403。
步骤403、终端检查是否有数据网络连接;若有数据网络连接,则执行正常的处理流程;若没有数据网络连接,则执行步骤404。
其中,所述的数据网络相当于前述实施例中的数据业务。所述正常的处理流程,指的是与现有技术相同的处理流程。
步骤404、终端缓存该语音任务,并打开数据开关,连接数据网络,禁止其它应用使用数据网络。
步骤405、终端通过数据网络,从服务器端获取执行该语音任务所需的数据流量F1。
步骤406、终端获取本终端的剩余流量F2,然后执行步骤407a或者407b。
步骤407a、终端判断数据流量F1是否小于预设阈值N1,若是,则执行步骤409,若否,则执行步骤408。
步骤407b、终端判断F2与F1的差值(或比值)是否大于预设阈值N2,若是,则执行步骤409,若否,则执行步骤408。
步骤408、终端将F1(或者F2,或者F1和F2)提示给用户,并请求用户确认是否继续执行,若接收到继续执行的指示,则执行步骤409,否则,终止。
在具体实现中,可以不包括步骤406,或者可以不包括步骤405,或者也可以同时包括步骤405和步骤406。当不包括步骤406时,在步骤405之后执行步骤407a。当不包括步骤405时,在步骤406之后,可以执行步骤407c(图中未示出);步骤407c为:终端判断F2是否大于预设阈值N3,若是,则执行步骤409,若否,则执行步骤408,在执行步骤408时,终端将F2提示给用户。
步骤409、终端从服务器获取该语音任务对应的响应,并反馈给用户。
图5为本发明实施例提供的另一种语音控制的处理方法的流程示意图。图5为上述各实施例提供的方法的一个具体例子,仅用于示例说明。如图5所示,所述方法包括:
步骤501、终端上的语音助手被唤醒,并接收到用户发出的语音任务。
步骤502、终端判断是否可以离线处理该语音任务;若可以离线处理,则执行正常的处理流程,即离线执行该语音任务;若不能离线处理,则执行步骤503。
步骤503、终端检查是否有数据网络连接;若有数据网络连接,则执行正常的处理流程;若没有数据网络连接,则执行步骤504。
步骤504、终端缓存该语音任务,并在本地查询执行该语音任务所需的数据流量F1。
步骤505、终端获取本终端的剩余流量F2,然后执行步骤506a或者506b。
步骤506a、终端判断数据流量F1是否小于预设阈值N1,若是,则执行步骤508,若否,则执行步骤507。
步骤506b、终端判断F2与F1的差值(或比值)是否大于预设阈值N2,若是,则执行步骤508,若否,则执行步骤507。
步骤507、终端将F1(或者F2,或者F1和F2)提示给用户,并请求用户确认是否继续执行,若接收到继续执行的指示,则执行步骤508,否则,终止。
在具体实现中,可以不包括步骤505,或者可以不包括步骤506,或者也可以同时包括步骤505和步骤506。具体参见图3或图4所示实施例中的相关描述。
步骤508、终端打开数据开关,连接数据网络,并禁止其它应用使用数据网络。
步骤509、终端从服务器获取该语音任务对应的响应,并反馈给用户。
图6为本发明实施例提供的另一种语音控制的处理方法的流程示意图。与图1-图5所示各实施例相比,本实施例的场景主要为:第一应用只能在终端开启数据业务时才能使用;由此,本实施例中,当处于关闭数据业务状态的终端接收到开启第一应用的指示之后,需要开启数据业务。
如图6所示,本实施例的方法可以包括:
步骤601、处于关闭数据业务状态的终端接收开启第一应用的指示。其中,该第一应用为终端中用于语音控制的应用程序。
第一应用可以处于打开或关闭的状态。在第一应用处于关闭状态时,终端可以接收开启第一应用的指示。在用户需要使用第一应用时,可以手动打开第一应用或者语音唤醒第一应用。或者,第一应用还可以在其它预设的条件下被打开。
本发明实施例应用于终端在处于关闭数据业务状态下接收到开启第一应用的指示的情况。
步骤602、在终端接收到开启第一应用的指示之后,开启数据业务。
由于本实施例中的第一应用仅能在终端开启数据业务时才能使用,所以在终端接收到开启第一应用的指示之后,终端开启数据业务。
步骤603、在终端接收到开启第一应用的指示之后,终端开启第一应用。
需要说明的是,本发明实施例并不限定步骤602和步骤603的先后顺序。
步骤604、终端禁止终端中第一应用以外的其它应用使用数据业务。
终端中可以包括多个应用,当终端开启数据业务之后,终端允许第一应用使用数据业务,同时,终端可以禁止除第一应用以外的其它应用使用数据业务。具体禁止的方法参见前述实施例步骤102中的描述。
本发明实施例并不限定步骤602、步骤603和步骤604之间的先后顺序。
本发明实施例,处于关闭数据业务状态的终端接收到开启第一应用的指示之后,开启第一应用并自动开启数据业务;并且终端还禁止除第一应用以外的其它应用使用数据业务。由此,使得处于关闭数据业务状态的终端在打开第一应用时可以自动开启数据业务,并限制其它应用使用数据业务,既方便了用户使用第一应用,又能够控制数据流量的使用。
在另一实施方式中,在步骤604之后,还可以包括如下步骤。
步骤605、在终端开启第一应用之后,终端通过第一应用接收语音指令。
终端开启第一应用之后,可以通过第一应用接收语音指令。在可选的方式中,终端可能同时接收开启第一应用的指示和语音指令。例如:用户说“Hey Siri,明天天气怎么样?”,则终端同时接收到了开启Siri的指示和语音指令。
其中,本实施例并不限定步骤605与步骤602的先后顺序。
在接收到语音指令之后,终端可以直接执行该语音指令。或者,终端可以根据执行该语音指令所需的数据流量来判断是否执行该语音指令,详见以下步骤606-步骤610。
步骤606、终端获取执行语音指令所需的数据流量。
步骤607、终端判断所需的数据流量的大小,若所需的数据流量较小,则执行步骤610,若所需的数据流量较大,则执行步骤608;具体的,若所需的数据流量小于或等于第一预设阈值,或者若终端的剩余流量与所需的数据流量的差值(或比值)大于或等于第二预设阈值,则执行步骤610;若所需的数据流量大于第一预设阈值,或者若终端的剩余流量与所需的数据流量的差值(或比值)小于第二预设阈值,则执行步骤608。
步骤608、终端发出是否执行该语音指令的提示。
步骤609、终端接收执行该语音指令的指示,然后执行步骤610。
步骤610、终端控制第一应用通过数据业务执行该语音指令。
其中,上述步骤606-步骤610的过程,详见前述实施例中步骤205a-步骤209a中的描述。
在终端接收到语音指令之后,根据执行该语音指令所需的流量来决定是否自动执行该语音指令。当所需的流量较小时,终端自动执行该语音指令,当所需的流量较多时,才经由用户确认;由此使得第一应用的使用更加便捷。
终端在处于关闭数据业务时若接收到开启第一应用的指示,则终端自动开启数据业务,并禁止其它应用使用数据业务,能够方便的使用语音控制,并能够很好的控制数据流量的使用情况。在开启数据业务之后,终端还可以基于可能要使用的数据流量来决定是否执行该语音指令。进一步对数据流量的使用进行控制。
可选的,在另一实施方式中,上述步骤606-步骤607可以替换为以下的步骤606’-步骤607’。
步骤606’、终端获取该语音指令对应的业务类型。
步骤607’、终端判断该语音指令对应的业务类型是否为被允许开启数据业务的类型,若是,则执行步骤610,若否,则执行步骤608。
其中,步骤606’-步骤607’的过程,详见前述实施例中步骤205a’-步骤206a’中的描述。
在终端接收到语音指令之后,根据该语音指令所属的业务类型来决定是否自动执行该语音指令。当业务类型为预先设定的被允许开启数据业务的类型时,终端自动执行该语音指令;由此使得第一应用的使用更加便捷。
在开启数据业务之后,终端还可以基于语音指令对应的业务类型来判断是否执行该语音指令;使得终端可以基于预先的设置,方便用户通过语音控制功能使用某些类型的应用。
图7为本发明实施例提供的另一种语音控制的处理方法的流程示意图。与图1-图6所示各实施例相比,本实施例的场景主要为:终端通过第一应用接收的语音指令中包括使用第二应用的指令。由此,本实施例中,终端可以允许第二应用和第一应用使用数据业务,而禁止其它应用使用数据业务;或者终端可以只允许第二应用使用数据业务。
如图7所示,本实施例的方法可以包括:
步骤701、处于关闭数据业务状态的终端通过第一应用接收语音指令之后,终端开启数据业务。其中,第一应用为终端中用于语音控制的应用程序;并且该语音指令包括使用终端中的至少一个第二应用的指令。
具体的,本步骤可以参见前述实施例中的步骤101。终端中可以包括多个应用。本实施例中,将语音指令中指示使用的应用称为第二应用。其中,第二应用与第一应用不同。第二应用例如可以为:高德地图、亚马逊、微信(社交类App)等。需要说明的是,本实施例中,语音指令中包括使用一个或多个第二应用的指令。例如:语音指令为“打开微信”或“HeySiri,打开微信”。
终端在接收到语音指令之后,可以自动开启数据业务。
步骤702、终端禁止终端中除第一应用和该至少一个第二应用以外的其它应用使用数据业务。
具体的禁止使用数据业务的操作可以参见前述实施例中步骤102中的描述。终端可以禁止除第一应用和第二应用以外的其它应用使用数据业务。也就是说,对于语音指令中指示使用的第二应用,终端允许该第二应用使用数据业务;对于第一应用,终端可以允许第一应用使用数据业务,也可以禁止第一应用使用数据业务;并且,终端禁止除第一应用和第二应用以外的其它应用使用数据业务。
步骤703、在终端开启数据业务之后,终端控制第二应用使用数据业务。
在终端开启数据业务之后,第二应用可以使用数据业务开始工作。终端可以不判断第二应用所需的数据流量,也可以不判断第二应用所属的业务类型,而是直接允许第二应用使用数据业务。在另一实施方式中,终端也可以根据第二应用所需的数据流量或者第二应用所属的业务类型来判断是否允许第二应用使用数据业务,具体的判断过程可以参见前述各实施例。例如:语音指令为“打开优酷(一个视频网站)”,则还是可以提示给用户,在得到确认之后,再打开优酷。
本实施例,在处于关闭数据业务状态的终端通过第一应用接收到语音指令之后,获取该语音指令指示要使用的第二应用,然后允许第二应用使用数据业务,并禁止其它应用使用数据业务。在终端处于关闭数据业务时,用户可以很方便的通过语音来唤醒需要使用数据业务的第二应用,而无需用户多步操作;并且同时禁止了其它应用使用数据业务,自动的对终端的数据流量进行了管控。
需要说明的是,在图1-图6所示的各实施例中,如果语音指令中包括执行第二应用的指示,则可以参考图7所示的实施例,允许第二应用使用数据业务。
图8为本发明实施例提供的一种终端的示意图,本发明实施例提供的终端可以用于实施上述图1-图7所示的各实施例中的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图1-图7所示的本发明各实施例。
如图8所示,该终端800可以包括输入单元801、处理器803、输出单元805、通信单元807、存储器809、电源811等组件。这些组件通过一条或多条总线进行通信。本领域技术人员可以理解,图8中示出的终端的结构并不构成对本发明实施例的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施方式中,所述终端可以是任何移动或便携式电子设备,包括但不限于移动电话、移动电脑、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、智能电视,以及上述两项或两项以上的组合等。
输入单元801用于实现用户与终端的交互和/或用于将信息输入到终端中。例如,输入单元可以接收用户输入的数字或字符信息,以产生与用户设置或功能控制有关的信号输入。在本发明具体实施方式中,输入单元可以是触控面板,也可以是其他人机交互界面,例如实体输入键、麦克风等,还可是其他外部信息撷取装置,例如摄像头等。触控面板,也称为触摸屏或触控屏,可收集用户在其上触摸或接近的操作动作。比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或接近触控面板的位置的操作动作,并根据预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸操作,并将检测到的触摸操作转换为电信号,以及将所述电信号传送给触摸控制器;触摸控制器从触摸检测装置上接收所述电信号,并将它转换成触点坐标,再送给处理器。所述触摸控制器还可以接收处理器发来的命令并执行。此外,可以采用电阻式、电容式、红外线(Infrared)以及表面声波等多种类型实现触控面板。在本发明的其他实施方式中,输入单元所采用的实体输入键可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。麦克风形式的输入单元可以收集用户或环境输入的语音并将其转换成电信号形式的、处理器可执行的命令。
在本发明的其他一些实施方式中,输入单元801还可以是各类传感器件,例如霍尔器件,用于侦测电子设备的物理量,例如力、力矩、压力、应力、位置、位移、速度、加速度、角度、角速度、转数、转速以及工作状态发生变化的时间等,将物理量转变成电量来进行检测和控制。其他的一些传感器件还可以包括重力感应计、三轴加速计、陀螺仪等。
处理器803为终端的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器可以仅包括中央处理器(Central Processing Unit,CPU),也可以是CPU、数字信号处理器(Digital Signal Processor,DSP)、及通信单元中的控制芯片(例如基带芯片)的组合。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元807用于建立通信信道,使终端通过所述通信信道以连接至远程服务器,并从远程服务器下载数据。所述通信单元可以包括无线局域网(Wireless Local AreaNetwork,wireless LAN)模块、蓝牙模块、基带(Base Band)模块等通信模块。所述通信模块对应的射频(Radio Frequency,RF)电路,用于进行无线局域网络通信、蓝牙通信、红外线通信及/或蜂窝式通信系统通信,例如宽带码分多重接入(Wideband Code DivisionMultiple Access,W-CDMA)及/或高速下行封包存取(High Speed Downlink PacketAccess,HSDPA)。所述通信模块用于控制终端中的各组件的通信,并且可以支持直接内存存取(Direct Memory Access)。
在本发明的不同实施方式中,通信单元中的各种通信模块一般以集成电路芯片(Integrated Circuit Chip)的形式出现,并可进行选择性组合,而不必包括所有通信模块及对应的天线组。例如,所述通信单元可以仅包括基带芯片、射频芯片以及相应的天线以在一个蜂窝通信系统中提供通信功能。经由所述通信单元建立的无线通信连接,例如无线局域网接入或WCDMA接入,所述终端可以连接至蜂窝网(Cellular Network)或因特网(Internet)。在本发明的一些可选实施方式中,所述通信单元中的通信模块,例如基带模块可以集成到处理器中,典型的如高通(Qualcomm)公司提供的APQ+MDM系列平台。
输出单元805包括但不限于影像输出单元和声音输出单元。影像输出单元用于输出文字、图片和/或视频。所述影像输出单元可包括显示面板,例如采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)、场发射显示器(field emission display,FED)等形式来配置的显示面板。或者所述影像输出单元可以包括反射式显示器,例如电泳式(electrophoretic)显示器,或利用光干涉调变技术(Interferometric Modulation of Light)的显示器。所述影像输出单元可以包括单个显示器或不同尺寸的多个显示器。在本发明的具体实施方式中,上述输入单元所采用的触控面板亦可同时作为输出单元的显示面板。例如,当触控面板检测到在其上的触摸或接近的手势操作后,传送给处理器以确定触摸事件的类型,随后处理器根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图8中,输入单元与输出单元是作为两个独立的部件来实现终端的输入和输出功能,但是在某些实施例中,可以将触控面板与显示面板集成一体而实现终端的输入和输出功能。例如,所述影像输出单元可以显示各种图形化用户接口(Graphical User Interface,GUI)以作为虚拟控制组件,包括但不限于窗口、卷动轴、图标及剪贴簿,以供用户通过触控方式进行操作。
在本发明具体实施方式中,影像输出单元包括滤波器及放大器,用来将处理器所输出的视频滤波及放大。音频输出单元包括数字模拟转换器,用来将处理器所输出的音频信号从数字格式转换为模拟格式。
存储器809可用于存储软件程序以及模块,处理器803通过运行存储在存储器的软件程序以及模块,从而执行终端的各种功能应用以及实现数据处理。存储器主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序,比如声音播放程序、图像播放程序等等;数据存储区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。在本发明具体实施方式中,存储器可以包括易失性存储器,例如非挥发性动态随机存取内存(Nonvolatile Random Access Memory,NVRAM)、相变化随机存取内存(Phase Change RAM,PRAM)、磁阻式随机存取内存(Magetoresistive RAM,MRAM)等,还可以包括非易失性存储器,例如至少一个磁盘存储器件、电子可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、闪存器件,例如反或闪存(NOR flash memory)或是反及闪存(NAND flash memory)。非易失存储器储存处理器所执行的操作系统及应用程序。所述处理器从所述非易失存储器加载运行程序与数据到内存并将数字内容储存于大量储存装置中。所述操作系统包括用于控制和管理常规系统任务,例如内存管理、存储设备控制、电源管理等,以及有助于各种软硬件之间通信的各种组件和/或驱动器。在本发明实施方式中,所述操作系统可以是Google公司的Android系统、Apple公司开发的iOS系统或Microsoft公司开发的Windows操作系统等,或者是Vxworks这类的嵌入式操作系统。
应用程序包括安装在终端上的任何应用,包括但不限于浏览器、电子邮件、即时消息服务、文字处理、键盘虚拟、窗口小部件(Widget)、加密、数字版权管理、语音识别、语音复制、定位(例如由全球定位系统提供的功能)、音乐播放等等。
电源811用于给终端的不同部件进行供电以维持其运行。作为一般性理解,所述电源可以是内置的电池,例如常见的锂离子电池、镍氢电池等,也包括直接向终端供电的外接电源,例如AC适配器等。在本发明的一些实施方式中,所述电源还可以作更为广泛的定义,例如还可以包括电源管理系统、充电系统、电源故障检测电路、电源转换器或逆变器、电源状态指示器(如发光二极管),以及与终端的电能生成、管理及分布相关联的其他任何组件。
为了实现本发明各实施例提供的方案,在终端的存储器中,可以增加两个新模块:流量统计模块和网络控制模块。
流量统计模块,用于统计语音助手的语音任务所需的流量,包括历史流量记录。
网络控制模块,用于控制数据业务的开关,以及控制其他应用是否使用数据业务。
处理器通过执行存储器中的相应指令来实现流量统计模块和网络控制模块的功能。
处理器803可以执行存储器809中存储的程序指令,来在实现上述图1-图7任一实施例所示的语音控制的处理方法。
图9为本发明实施例提供的一种语音控制处理装置的示意图。本发明实施例提供的语音控制处理装置包含在终端中,可以用于实施上述图1-图5所示各实施例中的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图1-图5所示的实施例。
如图9所示,一种语音控制处理装置900,包含在终端中,该装置900包括:开关模块902、禁止模块904和执行模块906。
开关模块902,用于在处于关闭数据业务状态的终端通过第一应用接收语音指令之后,开启数据业务。所述第一应用为所述终端中用于语音控制的应用程序。
禁止模块904,用于禁止所述终端中所述第一应用以外的其它应用使用所述数据业务。
执行模块906,用于在开关模块开启所述数据业务之后,控制所述第一应用通过所述数据业务执行所述语音指令。
可选的,开关模块902具体用于:自动开启数据业务。
可选的,开关模块902具体用于:获取执行所述语音指令所需的数据流量;若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)大于或等于第二预设阈值,则自动开启数据业务;若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)小于所述第二预设阈值,则发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,开启数据业务。
可选的,开关模块902具体用于:获取所述语音指令对应的业务类型;若所述业务类型为被允许开启数据业务的类型,则自动开启数据业务;若所述业务类型不是被允许开启数据业务的类型,则发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,开启数据业务。
可选的,执行模块906,具体用于:在所述终端开启所述数据业务之后,通过所述数据业务获取执行所述语音指令所需的数据流量;若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)大于或等于第二预设阈值,则控制所述第一应用通过所述数据业务执行所述语音指令;若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)小于所述第二预设阈值,则发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令。
可选的,执行模块906,具体用于:在所述终端开启所述数据业务之后,获取所述语音指令对应的业务类型;若所述业务类型为被允许开启数据业务的类型,则控制所述第一应用通过所述数据业务执行所述语音指令;若所述业务类型不是被允许开启数据业务的类型,则发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令。
可选的,所述装置900还包括:存储模块908,用于在所述处于关闭数据业务状态的终端通过所述第一应用接收所述语音指令之后,存储所述语音指令。
可选的,所述装置900还包括:识别模块910和控制模块912。识别模块910,用于在所述终端开启所述数据业务之前,对所述语音指令进行声纹识别。控制模块912,用于若所述语音指令的声纹被识别模块910识别为所述终端的用户的声纹,则控制开关模块902执行开启所述数据业务的步骤。
可选的,开关模块902还用于,在所述第一应用通过所述数据业务执行所述语音指令之后的预定时间段之后,关闭所述数据业务。
可选的,执行模块906还用于:在所述处于关闭数据业务状态的终端通过所述第一应用接收所述语音指令之前,打开所述第一应用。在所述终端的所述第一应用被打开时,在所述终端接收所述语音指令时,在所述终端开启数据业务时,在所述第一应用通过所述数据业务执行所述语音指令时,所述终端均处于熄屏状态。
可选的,执行模块906还用于:在所述处于关闭数据业务状态的终端通过所述第一应用接收所述语音指令之前,打开所述第一应用;其中,在所述终端的所述第一应用被打开时,所述终端处于熄屏状态。在所述第一应用通过所述数据业务执行所述语音指令的过程中,若所述终端能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于熄屏状态,若所述终端不能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于亮屏状态。
图10为本发明实施例提供的另一种语音控制处理装置的示意图。本发明实施例提供的语音控制处理装置包含在终端中,可以用于实施上述图6所示实施例中的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图6所示的实施例。
如图10所示,一种语音控制处理装置1000,包含在终端中,该装置1000包括:开关模块1002和禁止模块1004。
开关模块1002,用于在处于关闭数据业务状态的所述终端接收开启第一应用的指示之后,开启数据业务和开启所述第一应用。所述第一应用为所述终端中用于语音控制的应用程序。
禁止模块1004,用于禁止所述终端中所述第一应用以外的其它应用使用所述数据业务。
可选的,装置1000还包括:接收模块1006、流量获取模块1008和第一执行模块1010。
接收模块1006,用于在开启所述第一应用之后,通过所述第一应用接收语音指令。流量获取模块1008,用于获取执行所述语音指令所需的数据流量。第一执行模块1010,用于若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)大于或等于第二预设阈值,则控制所述第一应用通过所述数据业务执行所述语音指令。第一执行模块1010,还用于若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值(或比值)小于所述第二预设阈值,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令。
可选的,该装置1000还包括:接收模块1006、类型获取模块1012和第二执行模块1014。
接收模块1006,用于在开启所述第一应用之后,通过所述第一应用接收语音指令。类型获取模块1012,用于获取所述语音指令对应的业务类型。第二执行模块1014,用于若所述业务类型为被允许开启数据业务的类型,则控制所述第一应用通过所述数据业务执行所述语音指令。第二执行模块1014,还用于若所述业务类型不是被允许开启数据业务的类型,则发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令。
图11为本发明实施例提供的另一种语音控制处理装置的示意图。本发明实施例提供的语音控制处理装置包含在终端中,可以用于实施上述图7所示实施例中的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图7所示的实施例。
如图11所示,一种语音控制处理装置,包含在终端中,该装置1100可以包括:开关模块1102、禁止模块1104和执行模块1106。
开关模块1102,用于在处于关闭数据业务状态的所述终端通过第一应用接收语音指令之后,开启数据业务。所述第一应用为所述终端中用于语音控制的应用程序,所述语音指令包括使用所述终端中的至少一个第二应用的指令。
禁止模块1104,用于禁止所述终端中除所述第一应用和至少一个所述第二应用以外的其它应用使用所述数据业务。
执行模块1106,用于在所述终端开启所述数据业务之后,控制所述第二应用使用所述数据业务。
可选的,禁止模块1104还用于:禁止所述第一应用使用所述数据业务。
本发明实施例还提供一种终端,包括图9、图10或图11所示的语音控制处理装置。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外,任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的,盘(disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数字通用光碟(DVD)、软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (26)

1.一种语音控制的处理方法,其特征在于,包括:
处于关闭数据业务状态的终端通过第一应用接收语音指令之后,所述终端开启数据业务;所述第一应用为所述终端中用于语音控制的应用程序,所述处于所述关闭数据业务状态的终端不能与外部网络进行数据业务的交互;
在所述终端开启所述数据业务之后,所述终端禁止所述终端中所述第一应用以外的其它应用使用所述数据业务,处于开启数据业务状态的终端能够与外部网络进行数据业务的交互;
在所述终端开启所述数据业务之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。
2.根据权利要求1所述的方法,其特征在于,所述终端开启数据业务包括:
所述终端自动开启数据业务;
或者
所述终端获取执行所述语音指令所需的数据流量;
若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值大于或等于第二预设阈值,则所述终端自动开启数据业务;
若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值小于所述第二预设阈值,则所述终端发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,所述终端开启数据业务;
或者
所述终端获取所述语音指令对应的业务类型;
若所述业务类型为被允许开启数据业务的类型,则所述终端自动开启数据业务;
若所述业务类型不是被允许开启数据业务的类型,则所述终端发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,所述终端开启数据业务。
3.根据权利要求1所述的方法,其特征在于,所述在所述终端开启所述数据业务之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令,具体包括:
在所述终端开启所述数据业务之后,所述终端通过所述数据业务获取执行所述语音指令所需的数据流量;
若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值大于或等于第二预设阈值,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;
若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值小于所述第二预设阈值,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令;
或者
在所述终端开启所述数据业务之后,所述终端获取所述语音指令对应的业务类型;
若所述业务类型为被允许开启数据业务的类型,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;
若所述业务类型不是被允许开启数据业务的类型,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。
4.根据权利要求1-3任一所述的方法,其特征在于,在所述处于关闭数据业务状态的终端通过第一应用接收语音指令之后,所述方法还包括:所述终端存储所述语音指令。
5.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
在所述终端开启所述数据业务之前,所述终端对所述语音指令进行声纹识别;
若所述语音指令的声纹被识别为所述终端的用户的声纹,则执行所述终端开启所述数据业务的步骤。
6.根据权利要求1-3任一所述的方法,其特征在于,在所述终端控制所述第一应用通过所述数据业务执行所述语音指令之后,所述方法还包括:在预定时间段之后,所述终端关闭所述数据业务。
7.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
在所述处于关闭数据业务状态的终端通过第一应用接收语音指令之前,所述终端打开所述第一应用;
在所述终端打开所述第一应用时,在所述终端接收所述语音指令时,在所述终端开启数据业务时,在所述第一应用通过所述数据业务执行所述语音指令时,所述终端均处于熄屏状态。
8.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
在所述处于关闭数据业务状态的终端通过第一应用接收语音指令之前,所述终端打开所述第一应用;其中,在所述终端打开所述第一应用时,所述终端处于熄屏状态;
在所述终端控制所述第一应用通过所述数据业务执行所述语音指令的过程中,若所述终端能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于熄屏状态,若所述终端不能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于亮屏状态。
9.一种语音控制的处理方法,其特征在于,包括:
处于关闭数据业务状态的终端接收开启第一应用的指示,所述第一应用为所述终端中用于语音控制的应用程序,所述处于所述关闭数据业务状态的终端不能与外部网络进行数据业务的交互;
在所述终端接收到所述开启第一应用的指示之后,所述终端开启数据业务;
在所述终端接收到所述开启第一应用的指示之后,所述终端开启所述第一应用,并通过所述第一应用接收语音指令;
在所述终端开启所述数据业务之后,所述终端禁止所述终端中所述第一应用以外的其它应用使用所述数据业务,处于开启数据业务状态的终端能够与外部网络进行数据业务的交互;
在所述第一应用接收语音指令之后,所述终端获取执行所述语音指令所需的数据流量;
所述终端根据所述执行所述语音指令所需的数据流量控制所述第一应用通过所述数据业务执行所述语音指令。
10.根据权利要求9所述的方法,其特征在于,所述终端根据所述执行所述语音指令所需的数据流量控制所述第一应用通过所述数据业务执行所述语音指令包括:
若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值大于或等于第二预设阈值,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;
若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值小于所述第二预设阈值,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在所述第一应用接收语音指令之后,所述终端获取所述语音指令对应的业务类型;
若所述业务类型为被允许开启数据业务的类型,则所述终端控制所述第一应用通过所述数据业务执行所述语音指令;
若所述业务类型不是被允许开启数据业务的类型,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,所述终端控制所述第一应用通过所述数据业务执行所述语音指令。
12.一种语音控制的处理方法,其特征在于,包括:
处于关闭数据业务状态的终端通过第一应用接收语音指令之后,所述终端开启数据业务,所述第一应用为所述终端中用于语音控制的应用程序,所述语音指令包括使用所述终端中的至少一个第二应用的指令,所述处于所述关闭数据业务状态的终端不能与外部网络进行数据业务的交互;
在所述终端开启所述数据业务之后,所述终端禁止所述终端中除所述第一应用和至少一个所述第二应用以外的其它应用使用所述数据业务,处于开启数据业务状态的终端能够与外部网络进行数据业务的交互;
在所述终端开启所述数据业务之后,所述终端控制所述第二应用使用所述数据业务。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
所述终端还禁止所述第一应用使用所述数据业务。
14.一种语音控制处理装置,包含在终端中,其特征在于,所述装置包括:
开关模块,用于在处于关闭数据业务状态的所述终端通过第一应用接收语音指令之后,开启数据业务;所述第一应用为所述终端中用于语音控制的应用程序,所述处于关闭数据业务状态的终端不能与外部网络进行数据业务的交互;
禁止模块,用于禁止处于开启数据业务状态的所述终端中所述第一应用以外的其它应用使用所述数据业务;所述处于开启数据业务状态的终端能够与外部网络进行数据业务的交互;
执行模块,用于在所述开关模块开启所述数据业务之后,控制所述第一应用通过所述数据业务执行所述语音指令。
15.根据权利要求14所述的装置,其特征在于,
所述开关模块具体用于:自动开启数据业务;
或者
所述开关模块具体用于:
获取执行所述语音指令所需的数据流量;
若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值大于或等于第二预设阈值,则自动开启数据业务;
若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值小于所述第二预设阈值,则发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,开启数据业务;
或者
所述开关模块具体用于:
获取所述语音指令对应的业务类型;
若所述业务类型为被允许开启数据业务的类型,则自动开启数据业务;
若所述业务类型不是被允许开启数据业务的类型,则发出是否开启数据业务的提示;在接收到开启数据业务的指示之后,开启数据业务。
16.根据权利要求14所述的装置,其特征在于,
所述执行模块,具体用于:
在所述终端开启所述数据业务之后,通过所述数据业务获取执行所述语音指令所需的数据流量;
若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值大于或等于第二预设阈值,则控制所述第一应用通过所述数据业务执行所述语音指令;
若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值小于所述第二预设阈值,则发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令;
或者
所述执行模块,具体用于:
在所述终端开启所述数据业务之后,获取所述语音指令对应的业务类型;
若所述业务类型为被允许开启数据业务的类型,则控制所述第一应用通过所述数据业务执行所述语音指令;
若所述业务类型不是被允许开启数据业务的类型,则发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令。
17.根据权利要求14-16任一所述的装置,其特征在于,所述装置还包括:
存储模块,用于在所述处于关闭数据业务状态的终端通过所述第一应用接收所述语音指令之后,存储所述语音指令。
18.根据权利要求14-16任一所述的装置,其特征在于,所述装置还包括:
识别模块,用于在所述终端开启所述数据业务之前,对所述语音指令进行声纹识别;
控制模块,用于若所述语音指令的声纹被所述识别模块识别为所述终端的用户的声纹,则控制所述开关模块执行开启所述数据业务的步骤。
19.根据权利要求14-16任一所述的装置,其特征在于,所述开关模块还用于,在所述第一应用通过所述数据业务执行所述语音指令之后的预定时间段之后,关闭所述数据业务。
20.根据权利要求14-16任一所述的装置,其特征在于,
所述执行模块还用于:在所述处于关闭数据业务状态的终端通过所述第一应用接收所述语音指令之前,打开所述第一应用;
在所述终端的所述第一应用被打开时,在所述终端接收所述语音指令时,在所述终端开启数据业务时,在所述第一应用通过所述数据业务执行所述语音指令时,所述终端均处于熄屏状态。
21.根据权利要求14-16任一所述的装置,其特征在于,
所述执行模块还用于:在所述处于关闭数据业务状态的终端通过所述第一应用接收所述语音指令之前,打开所述第一应用;其中,在所述终端的所述第一应用被打开时,所述终端处于熄屏状态;
在所述第一应用通过所述数据业务执行所述语音指令的过程中,若所述终端能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于熄屏状态,若所述终端不能够通过语音响应所述语音指令,则在所述第一应用在执行所述语音指令的过程中所述终端处于亮屏状态。
22.一种语音控制处理装置,包含在终端中,其特征在于,所述装置包括:
开关模块,用于在处于关闭数据业务状态的所述终端接收开启第一应用的指示之后,开启数据业务和开启所述第一应用;所述第一应用为所述终端中用于语音控制的应用程序,所述处于关闭数据业务状态的终端不能与外部网络进行数据业务的交互;
禁止模块,用于禁止处于开启数据业务状态的所述终端中所述第一应用以外的其它应用使用所述数据业务,所述处于开启数据业务状态的终端能够与外部网络进行数据业务的交互;
接收模块,用于在开启所述第一应用之后,通过所述第一应用接收语音指令;
流量获取模块,用于在所述第一应用接收语音指令之后,获取执行所述语音指令所需的数据流量;
第一执行模块,用于根据所述语音指令所需的数据流量控制所述第一应用通过所述数据业务执行所述语音指令。
23.根据权利要求22所述的装置,其特征在于,所述根据所述语音指令所述的数据流量控制所述第一应用通过所述数据业务执行所述语音指令,包括:
若所述所需的数据流量小于或等于第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值大于或等于第二预设阈值,则控制所述第一应用通过所述数据业务执行所述语音指令;
若所述所需的数据流量大于所述第一预设阈值,或者若所述终端的剩余流量与所述所需的数据流量的差值小于所述第二预设阈值,则所述终端发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令。
24.根据权利要求22所述的装置,其特征在于,所述装置还包括:
类型获取模块,用于在所述第一应用接收语音指令之后,获取所述语音指令对应的业务类型;
第二执行模块,用于若所述业务类型为被允许开启数据业务的类型,则控制所述第一应用通过所述数据业务执行所述语音指令;
所述第二执行模块,还用于若所述业务类型不是被允许开启数据业务的类型,则发出是否执行所述语音指令的提示;在接收到执行所述语音指令的指示之后,控制所述第一应用通过所述数据业务执行所述语音指令。
25.一种语音控制处理装置,包含在终端中,其特征在于,包括:
开关模块,用于在处于关闭数据业务状态的所述终端通过第一应用接收语音指令之后,开启数据业务,所述第一应用为所述终端中用于语音交互的应用程序,所述语音指令包括使用所述终端中的至少一个第二应用的指令,所述处于关闭数据业务状态的所述终端不能与外部网络进行数据业务的交互;
禁止模块,用于禁止处于开启数据业务状态的所述终端中除所述第一应用和至少一个所述第二应用以外的其它应用使用所述数据业务,所述处于开启数据业务状态的终端能够与外部网络进行数据业务的交互;
执行模块,用于在所述终端开启所述数据业务之后,控制所述第二应用使用所述数据业务。
26.根据权利要求25所述的装置,其特征在于,所述禁止模块还用于:
禁止所述第一应用使用所述数据业务。
CN201580027959.7A 2015-09-30 2015-09-30 一种语音控制的处理方法和装置 Active CN107710148B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2015/091181 WO2017054158A1 (zh) 2015-09-30 2015-09-30 一种语音控制的处理方法和装置

Publications (2)

Publication Number Publication Date
CN107710148A CN107710148A (zh) 2018-02-16
CN107710148B true CN107710148B (zh) 2020-02-14

Family

ID=58422562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580027959.7A Active CN107710148B (zh) 2015-09-30 2015-09-30 一种语音控制的处理方法和装置

Country Status (4)

Country Link
US (1) US10777205B2 (zh)
EP (1) EP3349116A4 (zh)
CN (1) CN107710148B (zh)
WO (1) WO2017054158A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3460791A4 (en) * 2016-05-16 2019-05-22 Sony Corporation INFORMATION PROCESSING DEVICE
US11416212B2 (en) * 2016-05-17 2022-08-16 Microsoft Technology Licensing, Llc Context-based user agent
CN107564517A (zh) * 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
US20190172457A1 (en) * 2017-11-30 2019-06-06 Compal Electronics, Inc. Notebook computer and driving method of voice assistant system
CN110351690B (zh) * 2018-04-04 2022-04-15 炬芯科技股份有限公司 一种智能语音系统及其语音处理方法
CN110351419B (zh) * 2018-04-04 2021-08-24 炬芯科技股份有限公司 一种智能语音系统及其语音处理方法
CN108665900B (zh) 2018-04-23 2020-03-03 百度在线网络技术(北京)有限公司 云端唤醒方法及系统、终端以及计算机可读存储介质
CN109036398A (zh) * 2018-07-04 2018-12-18 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备及存储介质
CN110875041A (zh) * 2018-08-29 2020-03-10 阿里巴巴集团控股有限公司 语音控制方法、装置及系统
CN108986814A (zh) * 2018-09-04 2018-12-11 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
US10762893B2 (en) * 2018-09-28 2020-09-01 Comcast Cable Communications, Llc Monitoring of one or more audio/video collection devices
CN109788360A (zh) * 2018-12-12 2019-05-21 百度在线网络技术(北京)有限公司 基于语音的电视控制方法和装置
CN109688474A (zh) * 2018-12-28 2019-04-26 南京创维信息技术研究院有限公司 电视语音控制方法、装置和计算机可读存储介质
WO2020184753A1 (ko) * 2019-03-12 2020-09-17 엘지전자 주식회사 음성 추출 필터를 이용하여 음성 제어를 수행하는 인공 지능 장치 및 그 방법
WO2020206038A1 (en) * 2019-04-02 2020-10-08 Findyphone, Inc. Voice-enabled external smart battery processing system
CN110223687B (zh) * 2019-06-03 2021-09-28 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN112037784B (zh) * 2020-08-14 2023-10-20 南京创维信息技术研究院有限公司 显示设备语音控制方法、显示设备和存储介质
CN114125143B (zh) * 2020-08-31 2023-04-07 华为技术有限公司 一种语音交互方法及电子设备
US11757871B1 (en) * 2021-07-13 2023-09-12 T-Mobile Usa, Inc. Voice command security and authorization in user computing devices

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101472237A (zh) * 2007-12-25 2009-07-01 中国移动通信集团公司 Gprs数据业务的处理方法、设备及系统
CN101751361A (zh) * 2008-12-16 2010-06-23 联想(北京)有限公司 控制移动终端中数据传输接口的切换方法及终端设备
CN103428339A (zh) * 2012-05-17 2013-12-04 西安闻泰电子科技有限公司 通过语音输入控制手机进行操作的方法
CN104134442A (zh) * 2014-08-15 2014-11-05 广东欧珀移动通信有限公司 一种启动语音服务的方法及装置
CN104535074A (zh) * 2014-12-05 2015-04-22 惠州Tcl移动通信有限公司 基于蓝牙耳机的语音导航方法、系统和终端
CN104902430A (zh) * 2015-05-19 2015-09-09 广东欧珀移动通信有限公司 智能终端的流量控制方法和系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7149291B1 (en) * 2000-06-27 2006-12-12 Cisco Technology, Inc. Method and apparatus for reducing inbound traffic congestion in a voice frame network
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US8068881B2 (en) * 2002-08-09 2011-11-29 Avon Associates, Inc. Voice controlled multimedia and communications system
TW576045B (en) 2002-09-20 2004-02-11 Ind Tech Res Inst System for controlling network flow by monitoring download bandwidth
DE102004055722B3 (de) * 2004-11-18 2006-06-08 Siemens Ag Abschätzung des Bandbreitenbedarfs in einem Kommunikationsnetz mit Zugangskontrollen
US8104054B2 (en) * 2005-09-01 2012-01-24 At&T Intellectual Property I, L.P. Methods, systems, and devices for bandwidth conservation
US20100023876A1 (en) * 2008-07-28 2010-01-28 International Business Machines Corporation System and Method for Reducing Bandwidth Requirements of a Presentation Transmitted Across a Network
US8869307B2 (en) * 2010-11-19 2014-10-21 Mobile Iron, Inc. Mobile posture-based policy, remediation and access control for enterprise resources
US8750208B1 (en) * 2011-06-01 2014-06-10 Sprint Spectrum L.P. Processing an access request in a wireless communication system
CN102612084A (zh) 2012-02-24 2012-07-25 中兴通讯股份有限公司 一种控制数据流量的方法和装置
US9306771B1 (en) * 2012-11-16 2016-04-05 Sprint Spectrum L.P. Systems and methods of managing network communication
CN103871408B (zh) 2012-12-14 2017-05-24 联想(北京)有限公司 一种语音识别方法及装置、电子设备
US9271111B2 (en) * 2012-12-14 2016-02-23 Amazon Technologies, Inc. Response endpoint selection
EP3809407A1 (en) * 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US9818407B1 (en) * 2013-02-07 2017-11-14 Amazon Technologies, Inc. Distributed endpointing for speech recognition
US9245527B2 (en) * 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
GB2522299B (en) * 2013-11-26 2018-04-11 Tzvi Springer David Contextual audio recording
EP3100440A1 (en) * 2014-01-30 2016-12-07 Telefonaktiebolaget LM Ericsson (publ) Service specific traffic handling
US9767794B2 (en) * 2014-08-11 2017-09-19 Nuance Communications, Inc. Dialog flow management in hierarchical task dialogs
CN104572177A (zh) * 2014-12-19 2015-04-29 龙凤娇 一种手机流量管理的方法及装置
US10629207B2 (en) * 2017-07-13 2020-04-21 Comcast Cable Communications, Llc Caching scheme for voice recognition engines

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101472237A (zh) * 2007-12-25 2009-07-01 中国移动通信集团公司 Gprs数据业务的处理方法、设备及系统
CN101751361A (zh) * 2008-12-16 2010-06-23 联想(北京)有限公司 控制移动终端中数据传输接口的切换方法及终端设备
CN103428339A (zh) * 2012-05-17 2013-12-04 西安闻泰电子科技有限公司 通过语音输入控制手机进行操作的方法
CN104134442A (zh) * 2014-08-15 2014-11-05 广东欧珀移动通信有限公司 一种启动语音服务的方法及装置
CN104535074A (zh) * 2014-12-05 2015-04-22 惠州Tcl移动通信有限公司 基于蓝牙耳机的语音导航方法、系统和终端
CN104902430A (zh) * 2015-05-19 2015-09-09 广东欧珀移动通信有限公司 智能终端的流量控制方法和系统

Also Published As

Publication number Publication date
US20190043510A1 (en) 2019-02-07
US10777205B2 (en) 2020-09-15
WO2017054158A1 (zh) 2017-04-06
EP3349116A4 (en) 2019-01-02
CN107710148A (zh) 2018-02-16
EP3349116A1 (en) 2018-07-18

Similar Documents

Publication Publication Date Title
CN107710148B (zh) 一种语音控制的处理方法和装置
US11508383B2 (en) Method for operating content and electronic device for implementing same
CN105593868B (zh) 一种指纹识别方法、装置及移动终端
US9223990B2 (en) Method and apparatus for application management in user device
CN106297802B (zh) 用于在电子装置中执行语音命令的方法和设备
US8594737B2 (en) System and method for locating a misplaced mobile device
CN106062763B (zh) 一种显示应用、图片的方法、装置及电子设备
CN104951335B (zh) 应用程序安装包的处理方法及装置
TWI522917B (zh) 應用程式的啓動控制方法與裝置及電腦可讀取儲存介質
JP6765004B2 (ja) データ共有方法及び端末
CN104536978A (zh) 识别语音数据的方法和装置
US10805293B2 (en) Method for providing service update and electronic device supporting the same
JP2022116117A (ja) 認証ウィンドウ表示方法及び装置
KR102376964B1 (ko) 잠금 상태에서의 음성 명령을 기반으로 하는 기능 실행 운용 방법 및 이를 지원하는 전자 장치
CN108090345B (zh) linux系统外部命令执行方法及装置
CN111095211A (zh) 一种应用启动的控制方法及用户终端
US20140221047A1 (en) Method and apparatus for providing short-cut number in user device
CN108028869B (zh) 终端设备和处理来电的方法
US9621674B2 (en) Method and apparatus for associating online accounts
US20130311540A1 (en) Methods and devices for initiating a complementary application
CN106933626B (zh) 应用关联方法及装置
WO2014078930A1 (en) Contact prioritized communication for voice commands
CN108984212B (zh) 一种关闭进程的方法以及电子设备
US20150102670A1 (en) Method for operating booting and electronic device thereof
CN113900578A (zh) 用于ar眼镜的交互的方法、ar眼镜

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant