CN107122179A - 语音的功能控制方法和装置 - Google Patents

语音的功能控制方法和装置 Download PDF

Info

Publication number
CN107122179A
CN107122179A CN201710210831.5A CN201710210831A CN107122179A CN 107122179 A CN107122179 A CN 107122179A CN 201710210831 A CN201710210831 A CN 201710210831A CN 107122179 A CN107122179 A CN 107122179A
Authority
CN
China
Prior art keywords
user
function
voice
application
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710210831.5A
Other languages
English (en)
Inventor
潘葚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710210831.5A priority Critical patent/CN107122179A/zh
Publication of CN107122179A publication Critical patent/CN107122179A/zh
Priority to TW106139676A priority patent/TWI665656B/zh
Priority to EP18778228.9A priority patent/EP3575957B1/en
Priority to KR1020197018535A priority patent/KR102228964B1/ko
Priority to PCT/CN2018/080436 priority patent/WO2018177233A1/zh
Priority to MYPI2019003596A priority patent/MY194401A/en
Priority to JP2019535874A priority patent/JP6869354B2/ja
Priority to US16/447,536 priority patent/US10643615B2/en
Priority to PH12019501488A priority patent/PH12019501488A1/en
Priority to US16/820,098 priority patent/US10991371B2/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

本申请提供一种语音的功能控制方法,应用在终端的语音助手上,包括:根据对用户输入语音的识别结果,确定关联应用程序;所述关联应用程序用来实现用户要使用的功能;将用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据识别结果进行所述功能的实现。通过本申请的技术方案,能够更为准确和快速的完成用户需要的功能,提高语音功能控制的效率。

Description

语音的功能控制方法和装置
技术领域
本申请涉及网络通信技术领域,尤其涉及一种语音的功能控制方法和装置。
背景技术
语音助手是运行在终端上的一种软件,能够和用户进行语音交流,以及协助用户实现其指定的各项功能,如进行信息搜索、终端操作等。自从苹果推出其语音助手Siri以后,用户对语音助手类的软件的关注程度和使用率有了极大的提高,也给语音助手的发展带来了动力。
目前语音助手能够与安装在终端上的应用程序相结合,用户向语音助手发出执行某项任务的指令,由语音助手调用相应的应用程序来完成该项任务,从而极大的丰富了用户能够以语音助手为单一入口来完成的功能。
现有技术中,以Siri为例,Siri可以与六类应用程序(打车、通讯、照片搜索、支付、网络电话、健身)协作,当Siri接收到用户的语音输入时,判断用户的意图,并决定是由自己处理还是调用应用程序处理。如果决定调用应用程序,Siri从自己对用户语音的识别结果中提取相关信息交给应用程序。应用程序按照Siri提供的信息,执行该信息指定的功能。
可见,Siri提供的信息是用户指定的任务是否能被正确完成的基础。当Siri识别出的输入语音不够准确时,用户通过语音进行的功能控制就难以达到令人满意的水平。
发明内容
有鉴于此,本申请提供一种语音的功能控制方法,应用在终端的语音助手上,包括:
根据对用户输入语音的识别结果,确定关联应用程序;所述关联应用程序用来实现用户要使用的功能;
将用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据识别结果进行所述功能的实现。
本申请提供的一种语音的功能控制方法,应用在用来实现除语音助手外其他功能的终端应用程序上,包括:
接收来自语音助手的用户的输入语音;
识别用户的输入语音,根据识别结果进行用户要使用功能的实现。
本申请还提供了一种语音的功能控制装置,应用在终端的语音助手上,包括:
关联应用程序单元,用于根据对用户输入语音的识别结果,确定关联应用程序;所述关联应用程序用来实现用户要使用的功能;
输入语音传递单元,用于将用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据识别结果进行所述功能的实现。
本申请提供的一种语音的功能控制装置,应用在用来实现除语音助手外其他功能的终端应用程序上,包括:
输入语音接收单元,用于接收来自语音助手的用户的输入语音;
功能实现单元,用于识别用户的输入语音,根据识别结果进行用户要使用功能的实现。
由以上技术方案可见,本申请的实施例中,在语音助手根据对用户输入语音的识别结果确定关联应用程序后,将用户的输入语音传递给关联应用程序,由关联应用程序自行识别输入语音后执行用户的指令;由于关联应用程序都有其专属的应用领域,比如高德地图是地图及导航领域,因此在其所属的功能类型的语音识别准确度在绝大多数情况下高于通用于所有功能类型的语音助手的准确度,从而能够更为准确和快速的完成用户需要的功能,提高语音功能控制的效率。
附图说明
图1是本申请实施例中一种应用在终端的语音助手上、语音的功能控制方法的流程图;
图2是本申请实施例中一种应用在终端的应用程序上、语音的功能控制方法的流程图;
图3是本申请应用示例的工作原理示意图;
图4是终端的一种硬件结构图;
图5是本申请实施例中一种应用在终端的语音助手上、语音的功能控制装置的逻辑结构图;
图6是本申请实施例中一种应用在终端的应用程序上、语音的功能控制装置的逻辑结构图。
具体实施方式
现有技术中,终端上安装的很多非语音助手类的应用程序本身也具有接收用户语音输入,识别出并执行用户的语音指令,实现用户要使用功能的能力。简便起见,以下将语音助手类的应用程序称为语音助手,将非语音助手类、用来实现除语音助手外的其他功能的应用程序称为应用程序。
语音助手的设计初衷是作为与用户进行语音交互的统一入口,除了识别用户可能涉及所有功能类型的指令,还要陪用户聊天,因此语音助手词库的词汇范围极其广泛,并且其语音识别算法的优化也必须兼顾所有类型词汇的识别率。而应用程序往往专注于几项主要功能的实现,如地图类型应用程序专注于寻址、定位和导航,购物类型的应用程序专注于商品和交易等等,用户在采用这些应用程序时,意图基本确定是要使用应用程序专注的功能。因此应用程序中用于语音识别的词库的词汇范围同样集中在其专注的功能领域,语音识别算法的优化也是如此。
从发出语音指令后到等待终端给出响应的等待时长会极大的影响用户体验,因而可供进行语音识别的时间非常有限。在有限的时间内,在任何一个特定的功能领域,语音助手对用户意图使用该领域某个功能的输入语音的识别,在准确度上很难赶上属于该功能领域的应用程序进行的识别。
比如在地点名称上,高德地图的词库比Siri的词库更为全面准确;同时,由于有长期的关于地点方面的搜索的积累,高德地图的识别算法在识别地名上也比Siri更为精准,Siri在导航这个应用场景中没有更为可靠的地名、位置等数据作为参考,来优化其识别算法。
可见,现有技术中由语音助手将识别结果传递给应用程序的做法,实际上是由不擅长某个工作的一方来完成工作,将不准确的工作结果交给擅长该工作的另一方,另一方不得不以较差的工作结果为基础来执行任务,自然难以达到好的结果。
基于上述思路,本申请的实施例提出一种新的语音功能控制方法,由语音助手通过对用户输入语音的识别,确定实现用户意图的关联应用程序,再将输入语音传递给关联应用程序,由关联应用程序自行识别语音后实现用户要使用的功能,使得应用程序基于原始的输入语音执行用户指令,可以以自行识别的结果而不必以语音助手不理想的识别结果为基础来执行,从而能够更为准确和快速的完成用户需要的功能,以解决现有技术中存在的问题。
本申请的实施例中,语音助手和应用程序都运行在用户的终端上。语音助手可以运行在终端的操作系统层面,也可以是作为操作系统上层的应用来运行,不做限定。用户的终端可以是任何具有语音输入、计算和存储功能的设备,如手机、平板电脑、PC(PersonalComputer,个人电脑)、笔记本、服务器等,同样不做限定。
本申请实施例中,语音的功能控制方法应用在语音助手中的流程如图1所示,应用在应用程序中的流程如图2所示。
在语音助手上,步骤110,根据对用户输入语音的识别结果,确定关联应用程序。关联应用程序用来实现用户要使用的功能。
当语音助手接收到用户的语音输入后,识别用户的语音,如果用户的指令不涉及对哪个功能的使用、或者用户要使用的功能由语音助手来执行,则语音助手依据识别结果回复用户的输入,或者执行用户的指令。如果语音助手的识别结果是用户要使用某种由应用程序来执行的功能,则语音助手确定实现该功能的关联应用程序。
用户可能在输入语音中指定想使用的应用程序。在这种情形下,语音助手可以从对用户输入语音的识别结果中提取出应用程序名称,将该应用程序(即用户在输入语音中指定的应用程序)作为关联应用程序。例如,用户对语音助手说,“用滴滴帮我叫车回家”,语音助手识别出应用程序名称“滴滴”,则将应用程序滴滴作为关联应用程序。
如果用户没有在输入语音中指定想使用的应用程序,语音助手可以根据对用户输入语音的识别结果,确定用户要使用的功能,再按照用户要使用的功能在终端上安装的应用程序中确定关联应用程序。语音助手从识别结果中确定用户要使用的功能的方法可以参照各种现有技术实现,例如,可以预置各个功能的若干个关键词,如果对用户语音的识别结果命中了某个功能关键词,则可获知用户想要使用的功能是哪一个。
由用户要使用的功能确定关联应用程序的方式可以根据实际应用场景的需要来决定,以下以两个实现方式为例进行说明。
在第一个实现方式中,语音助手在识别出用户要使用的功能后,可以将终端上安装的应用程序中,能够实现用户要使用的功能、并且支持语音输入的一个到多个应用程序作为备选应用程序,将备选应用程序的名称显示给用户,供用户选择。在收到用户的选择结果后,语音助手将用户选定的应用程序作为关联应用程序。
在第二个实现方式中,可以在终端上维护要使用的功能与应用程序的映射关系。在识别出用户要使用的功能后,语音助手可以将与用户要使用的功能具有映射关系的应用程序作为关联应用程序。在前述以功能关键词来反映用户要使用的功能的例子中,可以在终端上保存一张功能关键词与应用程序的映射关系表,语音助手从对用户输入语音的识别结果中提取出功能关键词后,即可将与该功能关键词具有映射关系的应用程序作为关联应用程序。
在第二个实现方式中,要使用的功能与应用程序的映射关系可以由用户设置和/或修改,也可以由语音助手或操作系统生成,还可以同时应用这些方式,本申请的实施例不做限定。一个例子中,用户可以在语音助手或操作系统提供的设置项中设置语音输入时,要使用的功能和关联应用程序的映射关系(一个到多个功能对应于一个应用程序)。另一个例子中,可以把要实现某个功能时,用户最频繁采用的应用程序作为与该功能有映射关系的应用程序;具体而言,如果安装在终端上的实现某功能的应用程序只有一个,则将该应用程序作为与该功能有映射关系的应用程序;如果超过一个,则可以按照操作系统统计的用户使用每个实现该功能的应用程序的频率,将频率最高的一个作为与该功能有映射关系的应用程序。第三个例子中,用户还可以在实现某个功能的应用程序中,将该应用程序设置为语音输入时、与该功能有映射关系的应用程序,应用程序在收到用户的设置指令后,向语音助手提交本应用程序与要使用功能的映射关系;如用户在高德地图中设置语音输入时、与功能关键词“导航”具有映射关系,高德地图按照用户的操作将该设置项提交给Siri,Siri将这一映射关系保存起来,后续用户语音输入“导航去哪里”时,Siri将按照映射关系,以高德地图作为关联应用程序。
需要说明的是,上述两个确定关联应用程序的方式也可以结合应用。例如,当语音助手确定用户要使用的功能后,查询保存的功能与应用程序的映射关系,如果能查到与要使用的功能有映射关系的应用程序,则按照映射关系来确定关联应用程序;如果查不到,则将终端上能够实现要使用的功能、并且支持语音输入的应用程序给用户选择,并且按照用户选择确定关联应用程序。在用户选择后可以请用户设置该功能的默认关联应用程序,如果用户进行设置,则保存该功能与用户设置的应用程序的映射关系;如果没有进行设置,语音助手也可以在用户选择一个应用程序实现某个功能的次数和频率都超过设定阈值后,保存该应用程序与该功能的映射关系。例如,Siri维护的功能与应用程序的映射关系表中不包括“导航”这一功能的映射关系,在5次用户给出语音指令“导航去哪里”后,Siri将终端上安装的高德地图、百度地图和搜狗地图的应用程序名称显示给用户,由用户选择要使用哪个应用程序导航;如果用户有4次选择了高德地图,则Siri将“导航”这一功能与高德地图的映射关系保存至该映射关系表中;之后用户给出导航的语音指令时,Siri将直接以高德地图作为关联应用程序。
在语音助手上,步骤120,将用户的输入语音传递给关联应用程序,供关联应用程序对用户的输入语音进行识别,并根据识别结果进行该功能的实现。
在关联应用程序上,步骤210,接收来自语音助手的用户的输入语音。
语音助手在确定执行用户要使用功能的关联应用程序后,打开关联应用程序(包括启动该关联应用程序、将该关联应用程序置于前台运行等),将用户的输入语音传递给关联应用程序。
在关联应用程序上,步骤220,识别用户的输入语音,根据识别结果进行用户要使用功能的实现。
关联应用程序自行识别来自语音助手的用户的输入语音,按照识别结果,运行关联应用程序的业务处理逻辑,来实现用户要使用的功能。关联应用程序可以按照现有技术来进行语音识别和功能实现,不再赘述。
在一个例子中,语音助手可以将自己对用户输入语音的识别结果和用户的输入语音一并传递给关联应用程序。关联应用程序自行识别用户的输入语音,根据关联应用程序自己的识别结果和来自语音助手的识别结果,来实现用户要使用功能的实现。语音助手的识别结果可以作为供关联应用程序在语音识别时的参考,进一步增加识别的准确程度。
可见,本申请的实施例中,语音助手通过对用户输入语音的识别,确定实现用户要使用功能的关联应用程序,并将输入语音传递给关联应用程序,由关联应用程序自行识别输入语音后执行用户的指令,从而能够利用应用程序其在所属功能类型更为准确的语音识别结果,更为准确和快速的完成用户需要的功能,提高语音功能控制的效率。
在本申请的一个应用示例中,用户的苹果终端上安装有语音助手Siri和若干个能够完成各种类型功能的应用程序。Siri中保存有功能关键词和应用程序的映射关系表。一种映射关系表的示例如表1:
表1
本应用示例的工作原理如图3所示,在收到用户的输入语音后,Siri对输入语音进行识别,假设用户要使用的功能需要借助于其他应用程序来实现,Siri从识别结果中提取描述用户要使用功能的功能关键词,用功能关键词查找映射关系表。如果找到对应于该功能关键词的应用程序,则以该应用程序为关联应用程序。如果没有在表中找到该功能关键词,Siri将终端上安装的所有能够实现该功能、并且支持语音输入的应用程序名称显示给用户,请用户选择想用哪个应用程序。Siri将用户选定的应用程序作为关联应用程序。
Siri将关联应用程序置于前台运行,并把用户的输入语音通过操作系统传输给关联应用程序。关联应用程序识别用户的输入语音,按照自己的识别结果和业务流程来完成用户指令的任务。
例如,用户对Siri说,“转账2000给张三”。Siri识别出功能关键词“转账”,从表1查询到关联应用程序为支付宝。Siri打开支付宝,将用户的输入语音传递给支付宝。支付宝识别输入语音,启动转账业务流程,向用户显示“收款方:张三”、“转账金额:2000”等内容,在用户输入密码或验证指纹后即可完成转账。
与上述流程实现对应,本申请的实施例还提供了一种应用在终端语音助手上的语音的功能控制装置,和一种应用在终端应用程序上的语音的功能控制装置。这两种装置均可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为逻辑意义上的装置,是通过终端的CPU(Central Process Unit,中央处理器)将对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,除了图4所示的CPU、内存以及非易失性存储器之外,语音的功能控制装置所在的终端通常还包括用于进行无线信号收发的芯片等其他硬件,和/或用于实现网络通信功能的板卡等其他硬件。
图5所示为本申请实施例提供的一种语音的功能控制装置,应用在终端的语音助手上,包括关联应用程序单元和输入语音传递单元,其中:关联应用程序单元用于根据对用户输入语音的识别结果,确定关联应用程序;所述关联应用程序用来实现用户要使用的功能;输入语音传递单元用于将用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据识别结果进行所述功能的实现。
一个例子中,所述终端上维护有要使用的功能与应用程序的映射关系;所述关联应用程序单元具体用于:根据对用户输入语音的识别结果,确定用户要使用的功能,将与用户要使用的功能具有映射关系的应用程序作为关联应用程序。
上述例子中,所述要使用的功能与应用程序的映射关系,包括:功能关键词与应用程序的映射关系;所述关联应用程序单元具体用于:提取对用户输入语音的识别结果中的功能关键词,将与所述功能关键词具有映射关系的应用程序作为关联应用程序。
上述例子中,所述要使用的功能与应用程序的映射关系,包括:由用户设置的要使用的功能与应用程序的映射关系;和/或,以实现所述要使用的功能时,用户最频繁采用的应用程序作为与所述要使用的功能具有映射关系的应用程序;和/或,由某个应用程序提交的、所述应用程序与要使用功能的映射关系。
可选的,所述关联应用程序单元具体用于:根据对用户输入语音的识别结果,确定用户要使用的功能,将所述终端上能够实现所述功能、并且支持语音输入的若干个应用程序名称显示给用户供其选择,将用户选定的应用程序作为关联应用程序。
可选的,所述关联应用程序单元具体用于:提取对用户输入语音的识别结果中的应用程序名称,将输入语音中指定的应用程序作为关联应用程序。
可选的,所述输入语音传递单元具体用于:将所述识别结果和用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据关联应用程序的识别结果和语音助手的识别结果进行所述功能的实现。
图6所示为本申请实施例提供的一种语音的功能控制装置,应用在用来实现除语音助手外其他功能的终端应用程序上,包括输入语音接收单元和功能实现单元,其中:输入语音接收单元用于接收来自语音助手的用户的输入语音;功能实现单元用于识别用户的输入语音,根据识别结果进行用户要使用功能的实现。
可选的,所述输入语音接收单元具体用于:接收来自语音助手的用户的输入语音,以及语音助手对所述输入语音的识别结果;所述功能实现单元具体用于:识别用户的输入语音,根据自己的识别结果和来自语音助手的识别结果,进行用户要使用功能的实现。
一个例子中,所述装置还包括:映射关系提交单元,用于根据用户的指令,向语音助手提交本应用程序与要使用功能的映射关系。
上述例子中,所述本应用程序与要使用功能的映射关系,包括:本应用程序与功能关键词的映射关系。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (22)

1.一种语音的功能控制方法,应用在终端的语音助手上,其特征在于,包括:
根据对用户输入语音的识别结果,确定关联应用程序;所述关联应用程序用来实现用户要使用的功能;
将用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据识别结果进行所述功能的实现。
2.根据权利要求1所述的方法,其特征在于,所述终端上维护有要使用的功能与应用程序的映射关系;
所述根据对用户输入语音的识别结果,确定关联应用程序,包括:根据对用户输入语音的识别结果,确定用户要使用的功能,将与用户要使用的功能具有映射关系的应用程序作为关联应用程序。
3.根据权利要求2所述的方法,其特征在于,所述要使用的功能与应用程序的映射关系,包括:功能关键词与应用程序的映射关系;
所述根据对用户输入语音的识别结果,确定关联应用程序,包括:提取对用户输入语音的识别结果中的功能关键词,将与所述功能关键词具有映射关系的应用程序作为关联应用程序。
4.根据权利要求2或3所述的方法,其特征在于,所述要使用的功能与应用程序的映射关系,包括:
由用户设置的要使用的功能与应用程序的映射关系;和/或,
以实现所述要使用的功能时,用户最频繁采用的应用程序作为与所述要使用的功能具有映射关系的应用程序;和/或,
由某个应用程序提交的、所述应用程序与要使用功能的映射关系。
5.根据权利要求1所述的方法,其特征在于,所述根据对用户输入语音的识别结果,确定关联应用程序,包括:根据对用户输入语音的识别结果,确定用户要使用的功能,将所述终端上能够实现所述功能、并且支持语音输入的若干个应用程序名称显示给用户供其选择,将用户选定的应用程序作为关联应用程序。
6.根据权利要求1所述的方法,其特征在于,所述根据对用户输入语音的识别结果,确定关联应用程序,包括:提取对用户输入语音的识别结果中的应用程序名称,将输入语音中指定的应用程序作为关联应用程序。
7.根据权利要求1所述的方法,其特征在于,所述将用户的输入语音传递给所述关联应用程序,包括:将所述识别结果和用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据关联应用程序的识别结果和语音助手的识别结果进行所述功能的实现。
8.一种语音的功能控制方法,应用在用来实现除语音助手外其他功能的终端应用程序上,其特征在于,包括:
接收来自语音助手的用户的输入语音;
识别用户的输入语音,根据识别结果进行用户要使用功能的实现。
9.根据权利要求8所述的方法,其特征在于,所述接收来自语音助手的用户的输入语音,包括:接收来自语音助手的用户的输入语音,以及语音助手对所述输入语音的识别结果;
所述识别用户的输入语音,根据识别结果进行用户要使用功能的实现,包括:识别用户的输入语音,根据自己的识别结果和来自语音助手的识别结果,进行用户要使用功能的实现。
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:根据用户的指令,向语音助手提交本应用程序与要使用功能的映射关系。
11.根据权利要求10所述的方法,其特征在于,所述本应用程序与要使用功能的映射关系,包括:本应用程序与功能关键词的映射关系。
12.一种语音的功能控制装置,应用在终端的语音助手上,其特征在于,包括:
关联应用程序单元,用于根据对用户输入语音的识别结果,确定关联应用程序;所述关联应用程序用来实现用户要使用的功能;
输入语音传递单元,用于将用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据识别结果进行所述功能的实现。
13.根据权利要求12所述的装置,其特征在于,所述终端上维护有要使用的功能与应用程序的映射关系;
所述关联应用程序单元具体用于:根据对用户输入语音的识别结果,确定用户要使用的功能,将与用户要使用的功能具有映射关系的应用程序作为关联应用程序。
14.根据权利要求13所述的装置,其特征在于,所述要使用的功能与应用程序的映射关系,包括:功能关键词与应用程序的映射关系;
所述关联应用程序单元具体用于:提取对用户输入语音的识别结果中的功能关键词,将与所述功能关键词具有映射关系的应用程序作为关联应用程序。
15.根据权利要求13或14所述的装置,其特征在于,所述要使用的功能与应用程序的映射关系,包括:
由用户设置的要使用的功能与应用程序的映射关系;和/或,
以实现所述要使用的功能时,用户最频繁采用的应用程序作为与所述要使用的功能具有映射关系的应用程序;和/或,
由某个应用程序提交的、所述应用程序与要使用功能的映射关系。
16.根据权利要求12所述的装置,其特征在于,所述关联应用程序单元具体用于:根据对用户输入语音的识别结果,确定用户要使用的功能,将所述终端上能够实现所述功能、并且支持语音输入的若干个应用程序名称显示给用户供其选择,将用户选定的应用程序作为关联应用程序。
17.根据权利要求12所述的装置,其特征在于,所述关联应用程序单元具体用于:提取对用户输入语音的识别结果中的应用程序名称,将输入语音中指定的应用程序作为关联应用程序。
18.根据权利要求12所述的装置,其特征在于,所述输入语音传递单元具体用于:将所述识别结果和用户的输入语音传递给所述关联应用程序,供所述关联应用程序对用户的输入语音进行识别,并根据关联应用程序的识别结果和语音助手的识别结果进行所述功能的实现。
19.一种语音的功能控制装置,应用在用来实现除语音助手外其他功能的终端应用程序上,其特征在于,包括:
输入语音接收单元,用于接收来自语音助手的用户的输入语音;
功能实现单元,用于识别用户的输入语音,根据识别结果进行用户要使用功能的实现。
20.根据权利要求19所述的装置,其特征在于,所述输入语音接收单元具体用于:接收来自语音助手的用户的输入语音,以及语音助手对所述输入语音的识别结果;
所述功能实现单元具体用于:识别用户的输入语音,根据自己的识别结果和来自语音助手的识别结果,进行用户要使用功能的实现。
21.根据权利要求19所述的装置,其特征在于,所述装置还包括:映射关系提交单元,用于根据用户的指令,向语音助手提交本应用程序与要使用功能的映射关系。
22.根据权利要求21所述的装置,其特征在于,所述本应用程序与要使用功能的映射关系,包括:本应用程序与功能关键词的映射关系。
CN201710210831.5A 2017-03-31 2017-03-31 语音的功能控制方法和装置 Pending CN107122179A (zh)

Priority Applications (10)

Application Number Priority Date Filing Date Title
CN201710210831.5A CN107122179A (zh) 2017-03-31 2017-03-31 语音的功能控制方法和装置
TW106139676A TWI665656B (zh) 2017-03-31 2017-11-16 語音的功能控制方法和裝置
JP2019535874A JP6869354B2 (ja) 2017-03-31 2018-03-26 音声機能制御方法および装置
PCT/CN2018/080436 WO2018177233A1 (zh) 2017-03-31 2018-03-26 语音的功能控制方法和装置
KR1020197018535A KR102228964B1 (ko) 2017-03-31 2018-03-26 음성 기능 제어 방법 및 장치
EP18778228.9A EP3575957B1 (en) 2017-03-31 2018-03-26 Voice function control method and apparatus
MYPI2019003596A MY194401A (en) 2017-03-31 2018-03-26 Voice function control method and apparatus
US16/447,536 US10643615B2 (en) 2017-03-31 2019-06-20 Voice function control method and apparatus
PH12019501488A PH12019501488A1 (en) 2017-03-31 2019-06-25 Voice function control method and apparatus
US16/820,098 US10991371B2 (en) 2017-03-31 2020-03-16 Voice function control method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710210831.5A CN107122179A (zh) 2017-03-31 2017-03-31 语音的功能控制方法和装置

Publications (1)

Publication Number Publication Date
CN107122179A true CN107122179A (zh) 2017-09-01

Family

ID=59725277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710210831.5A Pending CN107122179A (zh) 2017-03-31 2017-03-31 语音的功能控制方法和装置

Country Status (9)

Country Link
US (2) US10643615B2 (zh)
EP (1) EP3575957B1 (zh)
JP (1) JP6869354B2 (zh)
KR (1) KR102228964B1 (zh)
CN (1) CN107122179A (zh)
MY (1) MY194401A (zh)
PH (1) PH12019501488A1 (zh)
TW (1) TWI665656B (zh)
WO (1) WO2018177233A1 (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783705A (zh) * 2017-10-20 2018-03-09 珠海市魅族科技有限公司 展示应用程序的方法、装置、计算机装置及存储介质
CN107919123A (zh) * 2017-12-07 2018-04-17 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
CN108231081A (zh) * 2017-12-29 2018-06-29 北京视觉世界科技有限公司 一种语音处理方法、装置、电子设备和存储介质
CN108231076A (zh) * 2018-01-04 2018-06-29 广州视源电子科技股份有限公司 一种语音控制方法、装置、设备及存储介质
CN108255462A (zh) * 2018-01-17 2018-07-06 北京网信云服信息科技有限公司 应用程序的操作方法及装置
CN108364647A (zh) * 2018-02-09 2018-08-03 智慧海派科技有限公司 基于语音识别的应用程序显示方法及移动终端
CN108428451A (zh) * 2018-03-12 2018-08-21 联想(北京)有限公司 语音控制方法、电子设备和语音控制系统
WO2018177233A1 (zh) * 2017-03-31 2018-10-04 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
CN108735211A (zh) * 2018-05-16 2018-11-02 智车优行科技(北京)有限公司 语音处理方法、装置、车辆、电子设备、程序及介质
CN108877811A (zh) * 2018-04-24 2018-11-23 中国地质大学(武汉) 一种基于声纹选择词汇的方法、设备及存储设备
CN108897552A (zh) * 2018-06-15 2018-11-27 联想(北京)有限公司 功能实现方法及系统
CN108986814A (zh) * 2018-09-04 2018-12-11 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109065047A (zh) * 2018-09-04 2018-12-21 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109658934A (zh) * 2018-12-27 2019-04-19 苏州思必驰信息科技有限公司 通过语音控制多媒体app的方法及装置
CN109725961A (zh) * 2017-10-31 2019-05-07 百度(美国)有限责任公司 使用自然语言处理基于用户输入执行任务的系统和方法
CN109828787A (zh) * 2019-01-17 2019-05-31 维沃移动通信有限公司 一种运行文件的方法、电子设备和云服务器
WO2019157894A1 (zh) * 2018-02-13 2019-08-22 Oppo广东移动通信有限公司 应用页面的显示方法、装置、存储介质及电子设备
CN110166417A (zh) * 2018-08-01 2019-08-23 腾讯科技(深圳)有限公司 任务执行方法、装置、计算机设备和存储介质
CN110231863A (zh) * 2018-03-06 2019-09-13 阿里巴巴集团控股有限公司 语音交互方法和车载设备
CN110620705A (zh) * 2018-06-19 2019-12-27 芜湖美的厨卫电器制造有限公司 智能浴室的控制终端和控制方法、电子设备
WO2020043055A1 (zh) * 2018-08-29 2020-03-05 阿里巴巴集团控股有限公司 交互方法、设备、存储介质和操作系统
CN110866179A (zh) * 2019-10-08 2020-03-06 上海博泰悦臻网络技术服务有限公司 一种基于语音助手的推荐方法、终端及计算机存储介质
CN111429597A (zh) * 2020-03-31 2020-07-17 腾讯科技(成都)有限公司 语音打卡方法、装置及存储介质
CN111742539A (zh) * 2018-08-07 2020-10-02 华为技术有限公司 一种语音控制命令生成方法及终端
WO2021081744A1 (zh) * 2019-10-29 2021-05-06 深圳市欢太科技有限公司 语音信息处理方法、装置、设备及存储介质
CN113053370A (zh) * 2019-12-27 2021-06-29 北京沃东天骏信息技术有限公司 唤醒应用的方法和装置
WO2021128921A1 (zh) * 2019-12-24 2021-07-01 深圳Tcl新技术有限公司 共享式语音交互方法、装置、设备及存储介质
CN113093596A (zh) * 2021-03-29 2021-07-09 北京金山云网络技术有限公司 一种控制指令的处理方法和装置
WO2022160911A1 (zh) * 2021-01-29 2022-08-04 青岛海信传媒网络技术有限公司 显示设备上语音方案的切换方法、显示设备及控制装置
WO2023000698A1 (zh) * 2021-07-23 2023-01-26 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品
WO2023093121A1 (zh) * 2021-11-29 2023-06-01 中兴通讯股份有限公司 语音控制方法、终端设备、服务器及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102455199B1 (ko) * 2017-10-27 2022-10-18 엘지전자 주식회사 인공지능 디바이스
US11487501B2 (en) * 2018-05-16 2022-11-01 Snap Inc. Device control using audio data
WO2020032927A1 (en) * 2018-08-07 2020-02-13 Google Llc Assembling and evaluating automated assistant responses for privacy concerns
WO2020116026A1 (ja) * 2018-12-07 2020-06-11 ソニー株式会社 応答処理装置、応答処理方法及び応答処理プログラム
CN109903763B (zh) 2019-01-11 2022-02-22 百度在线网络技术(北京)有限公司 服务控制方法、装置及设备
WO2020159190A1 (en) * 2019-01-28 2020-08-06 Samsung Electronics Co., Ltd. Method and apparatus for supporting voice instructions
CN111724775B (zh) * 2019-03-22 2023-07-28 华为技术有限公司 一种语音交互方法及电子设备
CN110851104A (zh) * 2019-10-28 2020-02-28 爱钱进(北京)信息科技有限公司 语音控制应用程序的方法、装置以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120022876A1 (en) * 2009-10-28 2012-01-26 Google Inc. Voice Actions on Computing Devices
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和系统
CN104346151A (zh) * 2013-07-30 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
US20150254057A1 (en) * 2014-03-04 2015-09-10 Microsoft Technology Licensing, Llc Voice-command suggestions
CN105094717A (zh) * 2015-07-15 2015-11-25 百度在线网络技术(北京)有限公司 基于语音输入的打印方法、打印装置和打印机
CN105183422A (zh) * 2015-08-31 2015-12-23 百度在线网络技术(北京)有限公司 语音控制应用程序的方法和装置
US20170083285A1 (en) * 2015-09-21 2017-03-23 Amazon Technologies, Inc. Device selection for providing a response

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000076040A (ja) * 1998-09-03 2000-03-14 Matsushita Electric Ind Co Ltd 音声入力ネットワーク端末装置
US7194409B2 (en) * 2000-11-30 2007-03-20 Bruce Balentine Method and system for preventing error amplification in natural language dialogues
US7209880B1 (en) * 2001-03-20 2007-04-24 At&T Corp. Systems and methods for dynamic re-configurable speech recognition
US20030008193A1 (en) 2001-06-28 2003-01-09 Foamex L.P. Liquid fuel delivery system for fuel cells
US8150872B2 (en) * 2005-01-24 2012-04-03 The Intellection Group, Inc. Multimodal natural language query system for processing and analyzing voice and proximity-based queries
US20070174214A1 (en) * 2005-04-13 2007-07-26 Robert Welsh Integrated fraud management systems and methods
US8234494B1 (en) * 2005-12-21 2012-07-31 At&T Intellectual Property Ii, L.P. Speaker-verification digital signatures
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7528713B2 (en) * 2006-09-28 2009-05-05 Ektimisi Semiotics Holdings, Llc Apparatus and method for providing a task reminder based on travel history
US8214208B2 (en) * 2006-09-28 2012-07-03 Reqall, Inc. Method and system for sharing portable voice profiles
US20110054895A1 (en) * 2007-03-07 2011-03-03 Phillips Michael S Utilizing user transmitted text to improve language model in mobile dictation application
US20110054894A1 (en) * 2007-03-07 2011-03-03 Phillips Michael S Speech recognition through the collection of contact information in mobile dictation application
WO2009123030A1 (ja) * 2008-04-02 2009-10-08 京セラ株式会社 ユーザインタフェース生成装置
US9292307B2 (en) * 2008-07-30 2016-03-22 Kyocera Corporation User interface generation apparatus
US20120310652A1 (en) * 2009-06-01 2012-12-06 O'sullivan Daniel Adaptive Human Computer Interface (AAHCI)
US9858925B2 (en) * 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10706373B2 (en) * 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
WO2011028842A2 (en) * 2009-09-02 2011-03-10 Sri International Method and apparatus for exploiting human feedback in an intelligent automated assistant
US8326624B2 (en) * 2009-10-26 2012-12-04 International Business Machines Corporation Detecting and communicating biometrics of recorded voice during transcription process
EP2390758A1 (en) * 2010-05-25 2011-11-30 Samsung Electronics Co., Ltd. Method and apparatus for managing an application being executed in a portable terminal
US20120136572A1 (en) * 2010-06-17 2012-05-31 Norton Kenneth S Distance and Location-Aware Reminders in a Calendar System
US8775156B2 (en) * 2010-08-05 2014-07-08 Google Inc. Translating languages in response to device motion
US8359020B2 (en) * 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
US8473289B2 (en) * 2010-08-06 2013-06-25 Google Inc. Disambiguating input based on context
US8812321B2 (en) * 2010-09-30 2014-08-19 At&T Intellectual Property I, L.P. System and method for combining speech recognition outputs from a plurality of domain-specific speech recognizers via machine learning
AU2011316955B2 (en) * 2010-10-20 2016-12-01 Playspan Inc. Flexible monetization service apparatuses, methods and systems
US20120108221A1 (en) * 2010-10-28 2012-05-03 Microsoft Corporation Augmenting communication sessions with applications
US20120158422A1 (en) * 2010-12-21 2012-06-21 General Electric Company Methods and systems for scheduling appointments in healthcare systems
CN102651217A (zh) * 2011-02-25 2012-08-29 株式会社东芝 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法
US8862255B2 (en) * 2011-03-23 2014-10-14 Audible, Inc. Managing playback of synchronized content
CN103688279A (zh) * 2011-04-25 2014-03-26 韦韦欧股份有限公司 用于智能个人时间表助理的系统和方法
US10057736B2 (en) * 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US20120310642A1 (en) * 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US9122981B1 (en) * 2011-06-15 2015-09-01 Amazon Technologies, Inc. Detecting unexpected behavior
US20130006633A1 (en) * 2011-07-01 2013-01-03 Qualcomm Incorporated Learning speech models for mobile device users
US8768707B2 (en) * 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US8452597B2 (en) * 2011-09-30 2013-05-28 Google Inc. Systems and methods for continual speech recognition and detection in mobile computing devices
CA3023918C (en) * 2011-09-30 2022-11-29 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
KR101934998B1 (ko) * 2011-10-04 2019-01-04 삼성전자주식회사 복수의 애플리케이션에 대한 사용자 인터페이스를 제공하는 방법 및 시스템
AU2013214801B2 (en) * 2012-02-02 2018-06-21 Visa International Service Association Multi-source, multi-dimensional, cross-entity, multimedia database platform apparatuses, methods and systems
JP5887162B2 (ja) * 2012-02-23 2016-03-16 株式会社Nttドコモ 通信端末、制御方法及びプログラム
US20130238326A1 (en) * 2012-03-08 2013-09-12 Lg Electronics Inc. Apparatus and method for multiple device voice control
WO2013185109A2 (en) * 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
CN113470640B (zh) * 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
WO2014144579A1 (en) * 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN103219005B (zh) * 2013-04-28 2016-01-20 北京云知声信息技术有限公司 一种语音识别方法及装置
US9292254B2 (en) * 2013-05-15 2016-03-22 Maluuba Inc. Interactive user interface for an intelligent assistant
TW201505023A (zh) * 2013-07-19 2015-02-01 Richplay Information Co Ltd 個人化語音助理之方法
KR102261552B1 (ko) * 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
US9548066B2 (en) * 2014-08-11 2017-01-17 Amazon Technologies, Inc. Voice application architecture
CN105469786A (zh) * 2014-08-22 2016-04-06 中兴通讯股份有限公司 语音识别的控制方法和装置
JP2016095383A (ja) * 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
US9824207B1 (en) * 2014-12-15 2017-11-21 Amazon Technologies, Inc. Authentication information update based on fraud detection
US10147421B2 (en) 2014-12-16 2018-12-04 Microcoft Technology Licensing, Llc Digital assistant voice input integration
US9398361B1 (en) * 2015-02-20 2016-07-19 Vxi Corporation Headset system with user-configurable function button
CN106157955A (zh) 2015-03-30 2016-11-23 阿里巴巴集团控股有限公司 一种语音控制方法及装置
US9921805B2 (en) 2015-06-17 2018-03-20 Lenovo (Singapore) Pte. Ltd. Multi-modal disambiguation of voice assisted input
US9811305B2 (en) * 2015-08-13 2017-11-07 Dell Products L.P. Systems and methods for remote and local host-accessible management controller tunneled audio capability
TWI557599B (zh) * 2015-11-05 2016-11-11 宏碁股份有限公司 語音控制方法及語音控制系統
CN105719649B (zh) * 2016-01-19 2019-07-05 百度在线网络技术(北京)有限公司 语音识别方法及装置
CN105825851B (zh) * 2016-05-17 2020-07-21 Tcl科技集团股份有限公司 一种基于Android系统的语音控制方法及系统
CN107122179A (zh) 2017-03-31 2017-09-01 阿里巴巴集团控股有限公司 语音的功能控制方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120022876A1 (en) * 2009-10-28 2012-01-26 Google Inc. Voice Actions on Computing Devices
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和系统
CN104346151A (zh) * 2013-07-30 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
US20150254057A1 (en) * 2014-03-04 2015-09-10 Microsoft Technology Licensing, Llc Voice-command suggestions
CN105094717A (zh) * 2015-07-15 2015-11-25 百度在线网络技术(北京)有限公司 基于语音输入的打印方法、打印装置和打印机
CN105183422A (zh) * 2015-08-31 2015-12-23 百度在线网络技术(北京)有限公司 语音控制应用程序的方法和装置
US20170083285A1 (en) * 2015-09-21 2017-03-23 Amazon Technologies, Inc. Device selection for providing a response

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10643615B2 (en) 2017-03-31 2020-05-05 Alibaba Group Holding Limited Voice function control method and apparatus
US10991371B2 (en) 2017-03-31 2021-04-27 Advanced New Technologies Co., Ltd. Voice function control method and apparatus
WO2018177233A1 (zh) * 2017-03-31 2018-10-04 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
CN107783705A (zh) * 2017-10-20 2018-03-09 珠海市魅族科技有限公司 展示应用程序的方法、装置、计算机装置及存储介质
CN109725961A (zh) * 2017-10-31 2019-05-07 百度(美国)有限责任公司 使用自然语言处理基于用户输入执行任务的系统和方法
CN107919123A (zh) * 2017-12-07 2018-04-17 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
CN107919123B (zh) * 2017-12-07 2022-06-03 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
CN108231081A (zh) * 2017-12-29 2018-06-29 北京视觉世界科技有限公司 一种语音处理方法、装置、电子设备和存储介质
CN108231076A (zh) * 2018-01-04 2018-06-29 广州视源电子科技股份有限公司 一种语音控制方法、装置、设备及存储介质
CN108255462A (zh) * 2018-01-17 2018-07-06 北京网信云服信息科技有限公司 应用程序的操作方法及装置
CN108364647A (zh) * 2018-02-09 2018-08-03 智慧海派科技有限公司 基于语音识别的应用程序显示方法及移动终端
WO2019157894A1 (zh) * 2018-02-13 2019-08-22 Oppo广东移动通信有限公司 应用页面的显示方法、装置、存储介质及电子设备
CN110231863A (zh) * 2018-03-06 2019-09-13 阿里巴巴集团控股有限公司 语音交互方法和车载设备
CN108428451B (zh) * 2018-03-12 2021-05-18 联想(北京)有限公司 语音控制方法、电子设备和语音控制系统
CN108428451A (zh) * 2018-03-12 2018-08-21 联想(北京)有限公司 语音控制方法、电子设备和语音控制系统
CN108877811A (zh) * 2018-04-24 2018-11-23 中国地质大学(武汉) 一种基于声纹选择词汇的方法、设备及存储设备
CN108735211A (zh) * 2018-05-16 2018-11-02 智车优行科技(北京)有限公司 语音处理方法、装置、车辆、电子设备、程序及介质
CN108897552A (zh) * 2018-06-15 2018-11-27 联想(北京)有限公司 功能实现方法及系统
CN110620705A (zh) * 2018-06-19 2019-12-27 芜湖美的厨卫电器制造有限公司 智能浴室的控制终端和控制方法、电子设备
CN110166417B (zh) * 2018-08-01 2021-10-01 腾讯科技(深圳)有限公司 任务执行方法、装置、计算机设备和存储介质
CN110166417A (zh) * 2018-08-01 2019-08-23 腾讯科技(深圳)有限公司 任务执行方法、装置、计算机设备和存储介质
CN111742539A (zh) * 2018-08-07 2020-10-02 华为技术有限公司 一种语音控制命令生成方法及终端
US11848016B2 (en) 2018-08-07 2023-12-19 Huawei Technologies Co., Ltd. Voice control command generation method and terminal
WO2020043055A1 (zh) * 2018-08-29 2020-03-05 阿里巴巴集团控股有限公司 交互方法、设备、存储介质和操作系统
CN108986814A (zh) * 2018-09-04 2018-12-11 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109065047B (zh) * 2018-09-04 2021-05-04 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109065047A (zh) * 2018-09-04 2018-12-21 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109658934A (zh) * 2018-12-27 2019-04-19 苏州思必驰信息科技有限公司 通过语音控制多媒体app的方法及装置
CN109828787A (zh) * 2019-01-17 2019-05-31 维沃移动通信有限公司 一种运行文件的方法、电子设备和云服务器
CN110866179A (zh) * 2019-10-08 2020-03-06 上海博泰悦臻网络技术服务有限公司 一种基于语音助手的推荐方法、终端及计算机存储介质
WO2021081744A1 (zh) * 2019-10-29 2021-05-06 深圳市欢太科技有限公司 语音信息处理方法、装置、设备及存储介质
WO2021128921A1 (zh) * 2019-12-24 2021-07-01 深圳Tcl新技术有限公司 共享式语音交互方法、装置、设备及存储介质
CN113053370A (zh) * 2019-12-27 2021-06-29 北京沃东天骏信息技术有限公司 唤醒应用的方法和装置
CN113053370B (zh) * 2019-12-27 2024-04-05 北京沃东天骏信息技术有限公司 唤醒应用的方法和装置
CN111429597A (zh) * 2020-03-31 2020-07-17 腾讯科技(成都)有限公司 语音打卡方法、装置及存储介质
CN111429597B (zh) * 2020-03-31 2021-11-02 腾讯科技(成都)有限公司 语音打卡方法、装置及存储介质
WO2022160911A1 (zh) * 2021-01-29 2022-08-04 青岛海信传媒网络技术有限公司 显示设备上语音方案的切换方法、显示设备及控制装置
CN113093596A (zh) * 2021-03-29 2021-07-09 北京金山云网络技术有限公司 一种控制指令的处理方法和装置
WO2023000698A1 (zh) * 2021-07-23 2023-01-26 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品
WO2023093121A1 (zh) * 2021-11-29 2023-06-01 中兴通讯股份有限公司 语音控制方法、终端设备、服务器及存储介质

Also Published As

Publication number Publication date
TW201837896A (zh) 2018-10-16
EP3575957A1 (en) 2019-12-04
JP6869354B2 (ja) 2021-05-12
KR20190089032A (ko) 2019-07-29
WO2018177233A1 (zh) 2018-10-04
US20190304461A1 (en) 2019-10-03
KR102228964B1 (ko) 2021-03-18
US20200219510A1 (en) 2020-07-09
PH12019501488A1 (en) 2020-03-02
TWI665656B (zh) 2019-07-11
EP3575957A4 (en) 2020-01-01
US10991371B2 (en) 2021-04-27
JP2020510852A (ja) 2020-04-09
EP3575957B1 (en) 2021-07-07
MY194401A (en) 2022-11-30
US10643615B2 (en) 2020-05-05

Similar Documents

Publication Publication Date Title
CN107122179A (zh) 语音的功能控制方法和装置
CN105095272B (zh) 基于图像识别的问答处理方法、装置及系统
CN109918485B (zh) 语音识别菜品的方法及装置、存储介质、电子装置
US20150254737A1 (en) Method, apparatus and system for providing customized service based on beacon signal
WO2017032084A1 (zh) 一种信息输出方法及装置
US11829433B2 (en) Contextual deep bookmarking
CN109345282A (zh) 一种业务咨询的响应方法及设备
CN106682006B (zh) 关于通信内容的信息提示方法和装置
CN107992210A (zh) 输入法词汇推荐方法、智能终端及具有存储功能的装置
CN105354459B (zh) 一种信息处理方法、装置及电子设备
CN107992523A (zh) 移动应用的功能选项查找方法及终端设备
CN108401005A (zh) 一种表情推荐方法和装置
CN103995891B (zh) 信息查询方法及装置
KR101584225B1 (ko) 메신저의 대화 내용을 바탕으로 추천 검색어를 제공하는 방법과 시스템 및 기록 매체
CN112307200A (zh) 情感属性获取方法、装置、设备、及存储介质
CN109616120A (zh) 一种基于语音的应用内交互方法及系统
CN104035971B (zh) 一种获取商品信息的方法和装置
TWI234762B (en) Voiceprint identification system for e-commerce
CN113987134A (zh) 工单检索方法、装置、电子设备及存储介质
CN115396556A (zh) 电话银行服务的控制方法及装置、存储介质及电子设备
KR101455669B1 (ko) 관심사항 기반 주소록 부가 서비스 제공 시스템, 이를 위한 장치 및 방법
CN110825844A (zh) 语音检索方法、装置、可读存储介质和电子设备
KR20160041264A (ko) 정보 검색 장치 및 방법
CN110287221A (zh) 消费记录生成方法、设备、存储介质及装置
CN110232138A (zh) 一种业务引导方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1243510

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.