CN102510426A - 个人助理应用访问方法及系统 - Google Patents

个人助理应用访问方法及系统 Download PDF

Info

Publication number
CN102510426A
CN102510426A CN2011103877026A CN201110387702A CN102510426A CN 102510426 A CN102510426 A CN 102510426A CN 2011103877026 A CN2011103877026 A CN 2011103877026A CN 201110387702 A CN201110387702 A CN 201110387702A CN 102510426 A CN102510426 A CN 102510426A
Authority
CN
China
Prior art keywords
user
authentication
application
voice signal
carried out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103877026A
Other languages
English (en)
Inventor
何婷婷
胡国平
胡郁
刘庆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN2011103877026A priority Critical patent/CN102510426A/zh
Publication of CN102510426A publication Critical patent/CN102510426A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及应用访问技术领域,公开了一种个人助理应用访问方法及系统,该方法包括:接收用户输入的语音信号;识别所述语音信号中的命令内容及参数;根据所述命令内容确定需要访问的应用,并根据所述参数对所述应用进行操作。利用本发明,可以提高人机交互效率。

Description

个人助理应用访问方法及系统
技术领域
本发明涉及应用访问技术领域,特别涉及一种个人助理应用访问方法及系统。
背景技术
计算机技术的普及发展促成了智能手机时代的到来,智能手机除具备传统手机的通话功能外,还实现了计算机的多数功能,如个人信息管理、网络交互(如电子邮件、即时通讯)以及其他各类增值服务(如股票交易、新闻检索、电子购物)等。融合3C(Computer、Communication、Consumer)的智能手机成为人们日常生活中不可或缺的助手,担当着越来越重要的职责。传统多级菜单设置下通过逐级选定实现交互的模式已经不适应功能日益复杂的智能手机应用,用户迫切需要一种更自然的交互模式,以便高效快捷地实现应用程序的准确定位。
发明内容
本发明实施例针对上述现有技术存在的问题,提供一种个人助理应用访问方法及系统,以提高人机交互效率。
本发明实施例提供如下技术方案:
一种个人助理应用访问方法,包括:
接收用户输入的语音信号;
识别所述语音信号中的命令内容及参数;
根据所述命令内容确定需要访问的应用,并根据所述参数对所述应用进行操作。
优选地,所述方法还包括:
在根据所述参数对所述应用进行操作之前,根据所述语音信号对所述用户进行身份认证,以确定所述用户是否为合法用户;
向所述应用的应用服务提供第三方发送身份认证结果,或者如果所述用户为合法用户,则根据所述参数对所述应用进行操作。
优选地,所述方法还包括:
在根据所述语音信号对所述用户进行身份认证之前,检查所述应用是否为需要通过身份认证保护的应用;
如果是,则执行所述根据所述语音信号对所述用户进行身份认证的步骤。
优选地,所述方法还包括:
如果所述应用为需要通过身份认证保护的应用,则对所述应用的直接调用方式进行修正。
优选地,所述方法还包括:
如果所述应用为需要通过身份认证保护的应用,则在对用户进行身份认证之前,检查所述应用的保护级别,并获取与所述保护级别对应的认证阈值;
所述对所述用户进行身份认证包括:根据所述认证阈值对所述用户进行身份认证。
优选地,所述对用户进行身份认证,以确定所述用户是否为合法用户包括:
从所述语音信号中对应所述命令内容的语音段提取声纹特征序列;
将所述声纹特征序列与背景模型进行匹配,得到第一相似度;
将所述声纹特征序列与注册用户的声纹模型进行匹配,得到第二相似度;
根据得到的第一相似度和第二相似度计算似然比;
如果所述似然比大于所述认证阈值,则确定所述用户是合法用户。
优选地,所述方法还包括:
如果所述用户是合法用户,则根据所述声纹特征序列对所述声纹模型进行更新。
可选地,所述注册用户的声纹模型为:与所述命令内容相关的用户声纹模型;或者文本无关的用户声纹模型。
优选地,所述识别所述语音信号中的命令内容及参数包括:
从所述语音信号中提取声学特征序列;
对所述声学特征序列进行连续语音解码,得到最优字串序列;
对所述最优字串序列进行文本语义分析,得到命令内容及参数。
一种个人助理应用访问系统,包括:
接收单元,用于接收用户输入的语音信号;
语音识别单元,用于识别所述语音信号中的命令内容及参数;
应用确定单元,用于根据所述命令内容确定需要访问的应用;
命令执行单元,用于根据所述参数对所述应用进行操作。
优选地,所述系统还包括:
认证单元,用于在所述命令执行单元根据所述参数对所述应用进行操作之前,根据所述接收单元接收的语音信号对所述用户进行身份认证,以确定所述用户是否为合法用户;
认证结果发送单元,用于向所述应用的应用服务提供第三方发送身份认证结果;或者
所述命令执行单元具体用于在所述认证单元确定所述用户为合法用户后,根据所述参数对所述应用进行操作。
优选地,所述系统还包括:
检查单元,用于在所述认证单元根据所述语音信号对所述用户进行身份认证之前,检查所述应用是否为需要通过身份认证保护的应用,如果是,则通知所述认证单元执行所述根据所述语音信号对所述用户进行身份认证的操作。
优选地,所述系统还包括:
修正单元,用于在所述检查单元检查到所述应用为需要通过身份认证保护的应用时,对所述应用的直接调用方式进行修正。
优选地,所述检查单元,还用于在所述应用为需要通过身份认证保护的应用时,在所述认证单元对用户进行身份认证之前,检查所述应用的保护级别,并获取与所述保护级别对应的认证阈值;
相应地,所述认证单元具体用于根据所述检查单元获取的认证阈值对所述用户进行身份认证。
优选地,所述认证单元包括:
声纹特征提取子单元,用于从所述语音信号中对应所述命令内容的语音段提取声纹特征序列;
第一匹配子单元,用于将所述声纹特征序列与背景模型进行匹配,得到第一相似度;
第二匹配子单元,用于将所述声纹特征序列与注册用户的声纹模型进行匹配,得到第二相似度;
计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
确定子单元,用于在所述似然比大于所述认证阈值时,确定所述用户是合法用户。
优选地,所述系统还包括:
模型更新单元,用于在所述确定子单元确定所述用户是合法用户后,根据所述声纹特征提取子单元提取的声纹特征序列对所述声纹模型进行更新。
优选地,所述语音识别单元包括:
声学特征提取子单元,用于从所述语音信号中提取声学特征序列;
语音解码子单元,用于对所述声学特征序列进行连续语音解码,得到最优字串序列;
语义分析子单元,用于对所述最优字串序列进行文本语义分析,得到命令内容及参数。
本发明实施例个人助理应用访问方法及系统,通过语音识别等技术识别用户输入的语音信号中的命令内容及参数,根据所述命令内容确定需要访问的应用,并根据所述参数对所述应用进行操作,也就是说,将用户自然的语音信号转化为可执行的应用程序指令,实现复杂应用程序的高效快捷的命令定向,提高人机交互效率,从而更好地实现智能设备的私人虚拟助理职能。
进一步地,通过声纹认证等技术在后台验证用户身份的有效性,还可实现对个人助理上应用的有效保护。
进一步地,还可以根据用户的实际需要,通过弹性身份认证方式,实现对不同应用的不同级别保护。
附图说明
为了更清楚地说明本发明实施的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例个人助理应用访问方法的流程图;
图2是本发明实施例个人助理应用访问方法的另一流程图;
图3是本发明实施例中对用户进行身份认证的流程图;
图4是本发明实施例个人助理应用访问方法的另一流程图;
图5是本发明实施例个人助理应用访问系统的一种结构示意图;
图6是本发明实施例个人助理应用访问系统的另一种结构示意图;
图7是本发明实施例个人助理应用访问系统的另一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于随着智能手机的普及和移动通讯技术的发展,移动设备的功能日益增强,更多地承担起私人助理的角色,用户在其上可实现众多个性化操作。而语音交互作为最自然的交互方式之一,可以在智能手机上可以发挥重要的作用。为此,本发明实施例个人助理应用访问方法及系统,通过语音识别等技术将用户自然的语音命令转化为可执行的应用程序指令,实现复杂应用程序的高效快捷的命令定向,从而更好地实现智能设备的私人虚拟助理职能。
如图1所示,是本发明实施例个人助理应用访问方法的流程图,包括以下步骤:
步骤101,接收用户输入的语音信号。
本发明实施例个人助理应用访问方法,支持用户以随意说的方式指示应用操作,也就是说,用户输入的语音信号可以是“打电话给XXX|”,“给XXX发邮件”,“去淘宝”等自然说的口令。该语音命令是连续的语音信号。在本发明实施例中,可以将用户输入的语音信号采样为一系列离散能量值存入数据缓存区。
步骤102,识别所述语音信号中的命令内容及参数。
从步骤101采集的语音能量值中提取出具有高表征力的声学特征,具体地,可以选用语音识别领域常用特征,比如MFCC(Mel Frequency CepstrumCoefficient,Mel频率倒谱系数)特征,按照时序顺序依次对窗长25ms帧移10ms的短帧语音做频谱变换得到M(比如M=39)维MFCC参数,将原始的易受噪音干扰的语音能量信号转换为具有更高鲁棒性的特征。
经过声学特征提取,连续语音能量信号可以表征为一系列的特征矢量O=(O1,O2,...,OT),其中T为语音总帧数,这些特征矢量组成了一个声学特征序列。
当然,为了进一步提高系统的鲁棒性,在上述过程中,还可以先对接收的用户输入的语音信号做前端降噪处理,以减少信道噪声及背景噪声的干扰,提高语音信噪比,进而提高后续系统对该信号的处理能力。
在提取出声学特征序列后,通过连续语音解码确定最优字串序列。具体地可采用传统经典算法实现,比如Token Passing算法等。
然后,对上述最优字串序列进行文本语义分析,得到命令内容及相应参数。
在本发明实施例中,可以采用基于文法规则匹配的算法从输入的连续语句中分别提取命令内容及对应参数。具体可以包括以下步骤:
1.系统预置应用程序调用规则,该规则由系统预先从海量文本数据中归纳总结得到。如“短消息”发送指令规则中包括确定的指令内容及可替换的命令参数等,比如:
a).[发送|发|发给][个|一个][$message][给]{$host:联系人};
b).[给]{$host:联系人}[发送|发|发给][个|一个][$message];
c).[告诉|通知|知会]{$host:联系人}。
在实际应用中,可以将所有规则统一放入一个规则库中。
2.对给定的连续输入的语句命令,对其遍历规则库中的规则进行匹配,获取匹配度最高的规则作为优选结果。
3.根据选定的规则形式,确定命令内容并从连续语句相应位置提取命令参数。
需要说明的是,本发明实施例并不仅限于上述语音识别过程来识别所述语音信号的命令内容及参数,还可以采用其它语音识别的方式,对此不再一一举例。
步骤103,根据所述命令内容确定需要访问的应用,并根据所述参数对所述应用进行操作。
本发明实施例个人助理应用访问方法,支持用户以随意说的方式指示应用操作。
比如,用户输入的语音信号为“打电话给张三”,通过上述步骤102,可以识别该语音信号的命令内容为“打电话”,相应的参数为“张三”;则根据该命令内容启动个人助理上的通话应用,如果通讯录中有“张三”的号码,还可以自动拨打该号码;如果没有相应的号码,则可以只进入拨号的应用,并向用户展现相应的界面。
再比如,用户输入的语音信号为“去淘宝”,通过上述步骤102,可以识别该语音信号的命令内容为“去”,相应的参数为“淘宝”;则在个人设备上搜索“淘宝”客户端并通过客户端登陆访问。
再比如,用户输入的语音信号为“查询合肥天气”,通过上述步骤102,可以识别该语音信号的命令内容为“查询”,相应的参数为“合肥天气”,则根据该命令内容启动个人助理上的无线上网功能,并在调用的浏览器内填入参数执行搜索功能。
另外,还可以允许用户自定义设置应用程序语音命令调用的关键字词等。
可见,本发明实施例个人助理应用访问方法,通过语音识别等技术识别用户输入的语音信号中的命令内容及参数,根据所述命令内容确定需要访问的应用,并根据所述参数对所述应用进行操作,从而实现复杂应用程序的高效快捷的命令定向,更好地实现智能设备的私人虚拟助理职能。
需要说明的是,上述个人助理可以是智能手机或其它类似设备。
由于功能强大的个人助理应用大大便利了用户的日常生活,促使人们越来越习惯于在个人助理上处理各种可能涉及用户个人信息的应用操作,如电子购物,股票交易等,因此相应的用户数据安全在信息发展的当今显得更为重要。为此,本发明实施例个人助理应用访问方法,还可进一步通过声纹认证等技术在后台验证用户身份的有效性,实现对个人助理上应用的有效保护,进而保证用户信息的安全性。
如图2所示,是本发明实施例个人助理应用访问方法的另一流程图,包括以下步骤:
步骤201,接收用户输入的语音信号。
步骤202,识别所述语音信号中的命令内容及参数。
步骤203,根据所述命令内容确定需要访问的应用。
步骤204,根据所述语音信号对所述用户进行身份认证,以确定所述用户是否为合法用户。
步骤205,根据身份认证结果执行相应语音命令。
具体地,可以向应用服务提供第三方提供身份认证结果,比如与应用服务提供第三方签有相应协议,将身份认证结果发送给应用服务提供第三方,应用服务提供第三方就无需再对该用户进行身份认证。或者,对本地端应用,在确认所述用户为合法用户后,根据所述参数对所述应用进行操作。
需要说明的是,上述步骤204中对所述用户进行身份认证的过程可以在系统后台进行,而且,上述步骤204也可以在步骤203之前进行。
另外,如果身份认证结果是所述用户不是合法用户,则可以向用户返回并显示用户身份不合法的提示信息,或者对用户指令提供受限的访问权限。
在本发明实施例中,可以采用传统的声纹识别技术,对用户进行身份认证。比如,可以采用GMM-UBM(Gaussian Mixture Model-UniversalBackground Model,基于高斯混合模型以及通用背景模型)算法,通过分别计算用户输入的语音信号中的命令内容所对应的语音段的声纹特征序列和用户声纹模型的匹配得分、以及该声纹行征序列和背景模型的匹配得分的比值,确定该比值与设定的认证阈值的大小关系,确定所述用户是否为合法用户。
另外,需要说明的是,为了方便用户的使用,有选择性地保护某些应用的安全性,可以允许用户通过自定义方式设置需要通过身份认证保护的应用。
相应地,在上述步骤203和步骤204之间,还需要检查所述应用是否为需要通过身份认证保护的应用。如果是,再执行步骤204;否则,可以直接根据所述参数对所述应用进行操作。
另外,为了方便用户的使用,个人设备上的应用可能不仅会提供语音调用方式,而且还提供非语音调用方式,比如,通过键盘输入命令调用相应应用。针对这种情况,为了防止非法用户避开语音方式调用受保护的应用,在本发明实施例中,还可进一步对设置了需要通过身份认证保护的应用的直接调用方式进行修正,比如在对该应用非语音调用时要求进行密码验证,或者提供受限功能等,从而可以确保对该应用程序的有效保护。
下面详细说明本发明实施例中对用户进行身份认证的过程。
如图3所示,是本发明实施例中对用户进行身份认证的流程图,包括以下步骤:
步骤301,从所述语音信号中对应所述命令内容的语音段提取声纹特征序列。
考虑到用户输入的语音信号中不仅包含有语音命令,还包含有随机变化的命令参数及用于连接的辅助词等信息,因此,可以首先从该语音信号中提取出相对固定的语音命令信息,比如前面所述的命令内容,并据此通过文本相关的声纹认证技术提高用户身份认证的准确度。
为此,在本发明实施例中,可以采用语音信号处理领域传统的关键词提取方法,如基于Filler模型的非关键词信号吸收或者关键词匹配等技术处理,从所述语音信号中提取出所述命令内容。然后,确定用户输入的语音信号中与该命令内容对应的语音段,从该语音段中提取声纹特征序列。
另外,还可以基于前面语音识别的结果,得到所述命令内容。然后,确定用户输入的语音信号中与该命令内容对应的语音段,从该语音段中提取声纹特征序列。
上述声纹特征序列包含一组声纹特征。该声纹特征主要有:谱包络参数语音特征,基音轮廓、共振峰频率带宽特征,线性预测系数,倒谱系数等。考虑到上述声纹特征的可量化性、训练样本的数量和系统性能的评价等问题,可以选用MFCC特征,对窗长25ms帧移10ms的每帧语音数据做短时分析得到MFCC参数及其一阶二阶差分,共计39维。这样,每句语音信号可以量化为一个39维声纹特征矢量序列X。
步骤302,将所述声纹特征序列与背景模型进行匹配,得到第一相似度。
所述背景模型用于描述说话人声纹的共性,可以采用基于多说话人数据训练具有1024甚至更多高斯数的复杂混合高斯模型,以更好地兼容各说话人的特异性。
具体地,帧数为T的声纹特征矢量序列X相应于背景模型(UBM)的似然度为:
p ( X | UBM ) = 1 T Σ t = 1 T Σ m = 1 M c m N ( X t ; μ m , Σ m ) - - - ( 1 )
其中,cm是第m个高斯的加权系数,满足
Figure BDA0000113934560000102
μm以及∑m分别是第m个高斯的均值和方差。其中N(.)满足正态分布,用于计算t时刻的声纹特征矢量Xt在单高斯分量上的似然度:
N ( X t ; μ m , Σ m ) = 1 ( 2 π ) n | Σ m | e - 1 2 ( X t - μ m ) ′ Σ m - 1 ( X t - μ m ) - - - ( 2 )
步骤303,将所述声纹特征序列与注册用户的声纹模型进行匹配,得到第二相似度。
所述注册用户声纹模型可以直接选择文本无关的模型,还可以细化选择语音命令内容相关的模型。
在该步骤中,可以首先根据上述命令内容获取注册用户相应的声纹模型,如果系统预置了该声纹模型则根据上述公式(2)的方式计算所述声纹特征序列与注册用户的文本相关声纹模型的似然度p(X|U)。否则选择计算所述声纹特征序列与注册用户的文本无关通用声纹模型的似然度p(X|U)
该说话人声纹模型可以是根据用户注册时录入的语音在线训练得到的混合高斯模型。
考虑到注册用语音样本往往有限,因此可以以上述背景模型为初始模型,通过各种自适应方法根据说话人的少量语音样本调整模型部分参数,比如基于MAP(Maximum A Posterior,最大后验概率)的自适应算法等,将用户声纹共性自适应为当前说话人个性,具体过程如下:
(1)从用户录入的注册语音信号中提取声纹特征。
(2)利用所述声纹特征自适应更新背景模型混合高斯的均值μm
具体地,新高斯均值
Figure BDA0000113934560000111
计算为样本统计量和原始高斯均值的加权平均,即:
μ m ^ = Σ t = 1 T γ m ( x t ) x t + τμ m Σ t = 1 T γ m ( x t ) + τ - - - ( 3 )
其中,xt表示第t帧声纹特征,γm(xt)表示第t帧声纹特征落于第m个高斯的概率,τ是遗忘因子,用于平衡历史均值以及语音样本对新高斯均值
Figure BDA0000113934560000113
的更新力度。一般来说,τ值越大,则新高斯均值
Figure BDA0000113934560000114
主要受原始均值制约;若τ值较小,则新高斯均值
Figure BDA0000113934560000115
主要由样本统计量决定,更多的体现了新样本分布的特点。
(3)复制背景模型方差作为所述注册用户的声纹模型方差。
(4)生成所述注册用户的声纹模型。
上述模型训练中可以采用系统预置的背景模型作为初始模型。
步骤304,根据得到的第一相似度和第二相似度计算似然比。
似然比为: p = p ( X | U ) p ( X | UBM ) - - - ( 3 )
其中,p(X|U)为所述声纹特征与注册用户的声纹模型的似然度,p(X|UBM)为所述声纹特征与背景模型的似然度。
步骤305,如果所述似然比大于设定的认证阈值,则确定所述用户是合法用户。
上述认证阈值可以是系统针对所有应用预设的一个值,当然也可以由用户来设定,对不同的应用,该认证阈值可以相同,也可以不同,以便对不同的应用起到不同的保护等级,具体将在后面详细描述。
当然,本发明实施例个人助理应用访问方法中,还可以采用其它方式对用户进行身份认证,对此本发明实施例不做限定。
可见,本发明实施例个人助理应用访问方法,不仅可以实现复杂应用程序的高效快捷的命令定向,而且,还可以通过声纹认证等技术在后台验证用户身份的有效性,实现对个人助理上应用的有效保护,进而保证用户信息的安全性。
在实际应用中,不同应用的安全性要求可能是不同的,因此,为了更好地满足用户对不同应用的不同级别保护,还可以采用弹性身份认证方式,根据用户主动设置的应用保护级别采用不同的身份认证标准。比如:
1.对一些通用程序或者没有设置保护级别的应用程序,不进行身份认证即直接响应,以提高系统处理效率。
2.对某些涉及到用户信息但保密性要求不高的应用,即设置为一般保护的应用程序采用较为宽松的身份认证准则,以保证有效用户以较高的通过率确认。
3.对某些涉及到用户信息高度机密的应用,即设置为重要保护的应用程序采用严格的身份认证,以确保可以拒绝绝大多数仿冒者的非法请求。
当然,本发明实施例个人助理应用访问方法并不仅限于上述弹性身份认证方式,具体可根据实际需要来设置,比如,只设两种保护级别,即需要认证和不需要认证,相应地,对用户访问相应的应用时,则同样对应两种情况:即需要认证和不需要认证。当然,对需要保护的不同应用,也可以设定多个不同的保护级别。
由前面图3所示对用户进行身份认证的流程可以看出,身份认证的松紧度主要取决于设定的认证阈值的大小。为此,可以针对不同的保护级别,设定不同的认证阈值。一般来说,保护级别越高,对应的认证阈值越大,要求用户在访问相应的应用时尽可能按照注册时录入的语音信号(即密码)的发音输入语音信号,以确保拒绝大多数仿冒者的非法请求;而对于某些涉及到用户信息但保密要求不高的应用,可以设置较低的保护级别,对应于较小的认证阈值,允许用户在访问相应的应用时输入的语音信号的发音与注册时录入的语音信号的发音存在一定的变化,以保证有效用户较高的认证通过率。
如图4所示,是本发明实施例个人助理应用访问方法的另一流程图,包括以下步骤:
步骤401,接收用户输入的语音信号。
步骤402,识别所述语音信号中的命令内容及参数。
步骤403,根据所述命令内容确定需要访问的应用。
步骤404,检查所述应用的保护级别,并获取与所述保护级别对应的认证阈值。
所述应用的保护级别可以由用户自己设定,由系统根据保护级别要求自动设置对应参数。另外还可以由用户主动设置系统参数以满足个性化需求。为了方便用户的使用,实现对应用程序有效保护的用户个性化定制,可以设置一应用程序保护库,用于记录需要保护的应用程序及保护级别。在该应用程序保护库中,可以建立应用程序与命令内容之间的对应关系,提供应用程序的保护级别,建立各种命令内容相关的用户声纹模型等。
上述应用程序保护库的访问可以仅对有权限的用户开放,提供添加、删除、更改等操作。比如,在该应用程序保护库中用户可自由添加各类应用程序,并自定义其对应的命令内容,如“电话”,“短信”,“邮件”,“股票”等等。为了提供交互的便利性,还可以允许同一应用程序对应多个命令内容,比“短消息”和“短信”可以对应同一应用程序。另外,还可以根据大众使用习惯,提供默认参数值供用户选择。
步骤405,根据所述认证阈值对所述用户进行身份认证,以确定所述用户是否为合法用户。
具体身份认证过程可参照前面图3所示流程,在此不再赘述。
步骤406,根据身份认证结果执行相应语音命令。
具体地,可以向应用服务提供第三方提供身份认证结果或者对本地端应用在所述用户为合法用户时根据所述参数对所述应用进行操作。
可见,本发明实施例个人助理应用访问方法,不仅可以实现复杂应用程序的高效快捷的命令定向,而且,还可以根据用户的实际需要,通过弹性身份认证方式,实现对不同应用的不同级别保护,进而保证用户信息的安全性。
由前面图3所示对用户进行身份认证的流程可以看出,身份认证的效果主要取决于背景模型和注册用户的声纹模型的精确度。因此,在本发明个人助理应用访问方法的其它实施例中,还可以包括以下步骤:如果所述用户是合法用户,则根据对用户进行身份认证时,从所述语音信号中对应所述命令内容的语音段提取声纹特征序列对所述用户的声纹模型进行更新。
上述声纹模型更新的过程可以在对所述应用进行操作完成后进行,也可以通过后台同步进行。
同样地,对注册用户声纹模型的更新可以采用自适应方法调整模型部分参数,如基于MAP(Maximum A Posterior,最大后验概率)的自适应算法等。若系统不存在文本相关的注册用户声纹模型,则设置文本无关的用户声纹模型为初始化模型,否则设置原文本相关用户声纹模型为初始化模型,并利用采集到的语音数据更新模型参数,具体过程如下:
(1)从用户录入的注册语音信号中提取声纹特征。
(2)利用所述声纹特征自适应更新背景模型混合高斯的均值μm
具体地,新高斯均值计算为样本统计量和原始高斯均值的加权平均,即:
μ m ^ = Σ t = 1 T γ m ( x t ) x t + τμ m Σ t = 1 T γ m ( x t ) + τ - - - ( 3 )
其中,xt表示第t帧声纹特征,γm(xt)表示第t帧声纹特征落于第m个高斯的概率,τ是遗忘因子,用于平衡历史均值以及语音样本对新高斯均值的更新力度。一般来说,τ值越大,则新高斯均值
Figure BDA0000113934560000144
主要受原始均值制约;若τ值较小,则新高斯均值
Figure BDA0000113934560000145
主要由样本统计量决定,更多的体现了新样本分布的特点。
(3)保持原注册用户的声纹模型方差不变。
相应地,本发明实施例还提供一种个人助理应用访问系统,如图5所示,是该系统的一种结构示意图。
在该实施例中,所述系统包括:接收单元501,语音识别单元502,应用确定单元503和命令执行单元504。其中:
接收单元501,用于接收用户输入的语音信号;
语音识别单元502,用于识别所述语音信号中的命令内容及参数;
应用确定单元503,用于根据所述命令内容确定需要访问的应用;
命令执行单元504,用于根据所述参数对所述应用进行操作
在该实施例中,所述用户输入的语音信号可以是“打电话给XXX”,“给XXX发邮件”,“去淘宝”等自然说的口令。
在本发明实施例中,语音接收单元501将用户输入的语音信号采样为一系列离散能量值存入数据缓存区。然后语音识别单元502从这些能量值中提取出具有高表征力的声学特征,经过声学特征提取,连续语音能量信号可以表征为一系列的特征矢量O=(O1,O2,...,OT),其中T为语音总帧数,这些特征矢量组成了一个声学特征序列。当然,为了进一步提高系统的鲁棒性,在上述过程中,还可以先对接收的用户输入的语音信号做前端降噪处理,以减少信道噪声及背景噪声的干扰,提高语音信噪比,进而提高后续系统对该信号的处理能力。
语音识别单元502在提取出上述声学特征序列后,通过连续语音解码确定最优字串序列。然后,对所述最优字串序列进行文本语义分析,即可得到命令内容及相应参数。
所述语音识别单元502的一种具体结构可以包括以下各子单元:
声学特征提取子单元,用于从所述语音信号中提取声学特征序列;
语音解码子单元,用于对所述声学特征序列进行连续语音解码,得到最优字串序列;
语义分析子单元,用于对所述最优字串序列进行文本语义分析,得到命令内容及参数。
需要说明的是,语音识别单元502并不仅限于上述语音识别过程及结构来识别所述语音信号的命令内容及参数,还可以采用其它语音识别的方式,对此不再一一举例。
在具体应用中,可以在所述系统中预先建立命令内容与应用的对应关系,一个应用可以对应多个命令内容,比如,“登录”、“上”“去”等命令内容可以对应同一个登录网站的应用或客户端,而具体登录哪个网站或调用哪个客户端则由识别出的参数来决定,比如“淘宝”、“百度”等。这样,应用确定单元503可以根据上述对应关系查找到所述命令内容对应的应用。然后,命令执行单元504根据语音识别单元502识别出的参数对所述应用进行操作。
本发明实施例个人助理应用访问系统,通过语音识别等技术识别用户输入的语音信号中的命令内容及参数,根据所述命令内容确定需要访问的应用,并根据所述参数对所述应用进行操作,从而实现复杂应用程序的高效快捷的命令定向,更好地实现智能设备的私人虚拟助理职能。
需要说明的是,该系统可以通过硬件及辅助软件的方式实现,可以应用于智能手机或其它类似个人助理设备中。
如图6所示,是本发明实施例个人助理应用访问系统的另一种结构示意图。
与图5所示实施例不同的是,在该实施例中,所述系统还进一步包括:认证单元601,用于在所述命令执行单元504根据所述参数对所述应用进行操作之前,根据接收单元501接收的语音信号对所述用户进行身份认证,以确定所述用户是否为合法用户。
相应地,在该实施例中,命令执行单元504需要在认证单元601确定所述用户为合法用户后,根据所述参数对所述应用进行操作,包括向应用程序服务提供第三方发送身份认证结果,或者是调用执行本地应用程序等。
在本发明系统另一实施例中,所述系统还可进一步包括:认证结果发送单元(未图示),用于向所述应用的应用服务提供第三方发送身份认证结果。
上述认证单元601对所述用户进行身份认证的过程可以在系统后台进行。具体地,上述认证单元601可以采用传统的文本相关声纹识别技术,对用户进行身份认证。比如,可以采用GMM-UBM算法,通过分别计算用户输入的语音信号中的命令内容所对应的语音段的声纹特征序列和用户声纹模型的匹配得分、以及该声纹行征序列和背景模型的匹配得分的比值,确定该比值与设定的认证阈值的大小关系,确定所述用户是否为合法用户。
在认证单元601的一种具体实施例中,该认证单元601可以包括以下各子单元:
声纹特征提取子单元,用于从所述语音信号中对应所述命令内容的语音段提取声纹特征序列;
第一匹配子单元,用于将所述声纹特征序列与背景模型进行匹配,得到第一相似度;
第二匹配子单元,用于将所述声纹特征序列与注册用户的声纹模型进行匹配,得到第二相似度;
计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
确定子单元,用于在所述似然比大于所述认证阈值时,确定所述用户是合法用户。
需要说明的是,所述注册用户的声纹模型可以是与所述命令内容相关的用户声纹模型;或者文本无关的用户声纹模型。
上述认证单元601对用户进行身份认证的详细过程可参照前面实施例中的描述,在此不再赘述。
当然,认证单元601还可以采用其它方式对用户进行身份认证,对此本发明实施例不做限定。
可见,本发明实施例个人助理应用访问系统,不仅可以实现复杂应用程序的高效快捷的命令定向,而且,还可以通过声纹认证等技术在后台验证用户身份的有效性,实现对个人助理上应用的有效保护,进而保证用户信息的安全性。
在实际应用中,不同应用的安全性要求可能是不同的,因此,为了更好地满足用户对不同应用的不同级别保护,还可以采用弹性身份认证方式,根据用户主动设置的应用保护级别采用不同的身份认证标准。
如图7所示,是本发明实施例个人助理应用访问系统的另一种结构示意图。
与图6所示实施例不同的是,在该实施例中,所述系统还进一步包括:检查单元701,用于在所述认证单元601根据所述语音信号对所述用户进行身份认证之前,检查所述应用是否为需要通过身份认证保护的应用,如果是,则通知所述认证单元601执行所述根据所述语音信号对所述用户进行身份认证的操作。
在实际应用中,不同应用的安全性要求可能是不同的,因此,为了更好地满足用户对不同应用的不同级别保护,还可以采用弹性身份认证方式,根据用户主动设置的应用保护级别采用不同的身份认证标准。
为此,在本发明系统的另一实施例中,图7所示的检查单元701还可用于在所述应用为需要通过身份认证保护的应用时,继续检查所述应用的保护级别,并获取与所述保护级别对应的认证阈值。
相应地,在该实施例中,认证单元601需要根据检查单元701获取的认证阈值对所述用户进行身份认证。具体认证过程可参照前面图3所示流程,在此不再详细描述。
可见,本发明实施例个人助理应用访问系统,不仅可以实现复杂应用程序的高效快捷的命令定向,而且,还可以根据用户的实际需要,通过弹性身份认证方式,实现对不同应用的不同级别保护,进而保证用户信息的安全性。
由于用户身份认证的效果主要取决于背景模型和注册用户的声纹模型的精确度。因此,在上述本发明个人助理应用访问系统图6、图7所示实施例中,还可进一步包括:模型更新单元(未图示),用于在认证单元601确定所述用户是合法用户(比如,可以由认证单元601中的确定子单元确定所述用户是合法用户)后,根据从所述语音接收单元501接收的语音信号中提取的声纹特征序列(比如,由认证单元601中的声纹特征提取子单元提取的声纹特征序列)对所述声纹模型进行更新。
需要说明的是,在实际应用中,上述模型更新单元可以作为独立的模块,从语音接收单元501接收的语音信号中提取的声纹特征序列,并根据该声纹特征序列对所述用户进行身份认证;上述模型更新单元也可以与所述认证单元601集成在一个模块上,具体如何实现本发明实施例不做限定。
另外,为了方便用户的使用,个人设备上的应用可能不仅会提供语音调用方式,而且还提供非语音调用方式,比如,通过键盘输入命令调用相应应用。针对这种情况,为了防止非法用户避开语音方式调用受保护的应用,在本发明系统另一实施例中,还可进一步包括:修正单元(未图示),用于在所述检查单元701检查到所述应用为需要通过身份认证保护的应用时,对所述应用的直接调用方式进行修正,比如在对该应用非语音调用时要求进行密码验证,或者提供受限功能等,从而可以确保对该应用程序的有效保护。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (17)

1.一种个人助理应用访问方法,其特征在于,包括:
接收用户输入的语音信号;
识别所述语音信号中的命令内容及参数;
根据所述命令内容确定需要访问的应用,并根据所述参数对所述应用进行操作。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
在根据所述参数对所述应用进行操作之前,根据所述语音信号对所述用户进行身份认证,以确定所述用户是否为合法用户;
向所述应用的应用服务提供第三方发送身份认证结果,或者如果所述用户为合法用户,则根据所述参数对所述应用进行操作。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
在根据所述语音信号对所述用户进行身份认证之前,检查所述应用是否为需要通过身份认证保护的应用;
如果是,则执行所述根据所述语音信号对所述用户进行身份认证的步骤。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述应用为需要通过身份认证保护的应用,则对所述应用的直接调用方式进行修正。
5.如权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述应用为需要通过身份认证保护的应用,则在对用户进行身份认证之前,检查所述应用的保护级别,并获取与所述保护级别对应的认证阈值;
所述对所述用户进行身份认证包括:根据所述认证阈值对所述用户进行身份认证。
6.如权利要求5所述的方法,其特征在于,所述对用户进行身份认证,以确定所述用户是否为合法用户包括:
从所述语音信号中对应所述命令内容的语音段提取声纹特征序列;
将所述声纹特征序列与背景模型进行匹配,得到第一相似度;
将所述声纹特征序列与注册用户的声纹模型进行匹配,得到第二相似度;
根据得到的第一相似度和第二相似度计算似然比;
如果所述似然比大于所述认证阈值,则确定所述用户是合法用户。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
如果所述用户是合法用户,则根据所述声纹特征序列对所述声纹模型进行更新。
8.如权利要求6所述的方法,其特征在于,所述注册用户的声纹模型为:与所述命令内容相关的用户声纹模型;或者文本无关的用户声纹模型。
9.如权利要求1至8任一项所述的方法,其特征在于,所述识别所述语音信号中的命令内容及参数包括:
从所述语音信号中提取声学特征序列;
对所述声学特征序列进行连续语音解码,得到最优字串序列;
对所述最优字串序列进行文本语义分析,得到命令内容及参数。
10.一种个人助理应用访问系统,其特征在于,包括:
接收单元,用于接收用户输入的语音信号;
语音识别单元,用于识别所述语音信号中的命令内容及参数;
应用确定单元,用于根据所述命令内容确定需要访问的应用;
命令执行单元,用于根据所述参数对所述应用进行操作。
11.如权利要求10所述的系统,其特征在于,所述系统还包括:
认证单元,用于在所述命令执行单元根据所述参数对所述应用进行操作之前,根据所述接收单元接收的语音信号对所述用户进行身份认证,以确定所述用户是否为合法用户;
认证结果发送单元,用于向所述应用的应用服务提供第三方发送身份认证结果;或者
所述命令执行单元具体用于在所述认证单元确定所述用户为合法用户后,根据所述参数对所述应用进行操作。
12.如权利要求11所述的系统,其特征在于,所述系统还包括:
检查单元,用于在所述认证单元根据所述语音信号对所述用户进行身份认证之前,检查所述应用是否为需要通过身份认证保护的应用,如果是,则通知所述认证单元执行所述根据所述语音信号对所述用户进行身份认证的操作。
13.如权利要求12所述的系统,其特征在于,所述系统还包括:
修正单元,用于在所述检查单元检查到所述应用为需要通过身份认证保护的应用时,对所述应用的直接调用方式进行修正。
14.如权利要求12所述的系统,其特征在于,
所述检查单元,还用于在所述应用为需要通过身份认证保护的应用时,在所述认证单元对用户进行身份认证之前,检查所述应用的保护级别,并获取与所述保护级别对应的认证阈值;
所述认证单元具体用于根据所述检查单元获取的认证阈值对所述用户进行身份认证。
15.如权利要求14所述的系统,其特征在于,所述认证单元包括:
声纹特征提取子单元,用于从所述语音信号中对应所述命令内容的语音段提取声纹特征序列;
第一匹配子单元,用于将所述声纹特征序列与背景模型进行匹配,得到第一相似度;
第二匹配子单元,用于将所述声纹特征序列与注册用户的声纹模型进行匹配,得到第二相似度;
计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
确定子单元,用于在所述似然比大于所述认证阈值时,确定所述用户是合法用户。
16.如权利要求15所述的系统,其特征在于,所述系统还包括:
模型更新单元,用于在所述确定子单元确定所述用户是合法用户后,根据所述声纹特征提取子单元提取的声纹特征序列对所述声纹模型进行更新。
17.如权利要求10至16任一项所述的系统,其特征在于,所述语音识别单元包括:
声学特征提取子单元,用于从所述语音信号中提取声学特征序列;
语音解码子单元,用于对所述声学特征序列进行连续语音解码,得到最优字串序列;
语义分析子单元,用于对所述最优字串序列进行文本语义分析,得到命令内容及参数。
CN2011103877026A 2011-11-29 2011-11-29 个人助理应用访问方法及系统 Pending CN102510426A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103877026A CN102510426A (zh) 2011-11-29 2011-11-29 个人助理应用访问方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103877026A CN102510426A (zh) 2011-11-29 2011-11-29 个人助理应用访问方法及系统

Publications (1)

Publication Number Publication Date
CN102510426A true CN102510426A (zh) 2012-06-20

Family

ID=46222479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103877026A Pending CN102510426A (zh) 2011-11-29 2011-11-29 个人助理应用访问方法及系统

Country Status (1)

Country Link
CN (1) CN102510426A (zh)

Cited By (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102938945A (zh) * 2012-10-17 2013-02-20 上海移远通信技术有限公司 无线通讯模块及其控制方法
CN102945669A (zh) * 2012-11-14 2013-02-27 四川长虹电器股份有限公司 一种家电设备语音控制方法
CN103051781A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 语音后台控制方法及移动终端
CN103077714A (zh) * 2013-01-29 2013-05-01 华为终端有限公司 信息的识别方法和装置
CN103077721A (zh) * 2012-12-25 2013-05-01 百度在线网络技术(北京)有限公司 移动终端的语音备忘方法及移动终端
CN103281446A (zh) * 2013-05-09 2013-09-04 百度在线网络技术(北京)有限公司 语音短信发送系统和方法
CN103500578A (zh) * 2013-10-22 2014-01-08 上海云视科技有限公司 语音操控方法和装置
CN103631519A (zh) * 2012-08-27 2014-03-12 三星电子株式会社 用于提供用户界面的方法和设备
CN103632667A (zh) * 2013-11-25 2014-03-12 华为技术有限公司 声学模型优化方法、装置及语音唤醒方法、装置和终端
CN103730120A (zh) * 2013-12-27 2014-04-16 深圳市亚略特生物识别科技有限公司 电子设备的语音控制方法及系统
CN103838991A (zh) * 2014-02-20 2014-06-04 联想(北京)有限公司 一种信息处理方法及电子设备
CN104168270A (zh) * 2014-07-31 2014-11-26 腾讯科技(深圳)有限公司 身份验证方法、服务器、客户端及系统
CN104282307A (zh) * 2014-09-05 2015-01-14 中兴通讯股份有限公司 唤醒语音控制系统的方法、装置及终端
CN104506901A (zh) * 2014-11-12 2015-04-08 科大讯飞股份有限公司 基于电视场景状态及语音助手的语音辅助方法及系统
CN104660792A (zh) * 2013-11-21 2015-05-27 腾讯科技(深圳)有限公司 唤醒应用的方法及装置
WO2015081681A1 (en) * 2013-12-03 2015-06-11 Tencent Technology (Shenzhen) Company Limited Systems and methods for audio command recognition
CN104834531A (zh) * 2015-05-29 2015-08-12 中山大学 一种盲人计算机的命令匹配系统及其实现方法
CN104902070A (zh) * 2015-04-13 2015-09-09 青岛海信移动通信技术股份有限公司 一种移动终端语音控制的方法及移动终端
CN104995865A (zh) * 2013-03-14 2015-10-21 英特尔公司 基于声音和/或面部辨识的服务提供
CN105144171A (zh) * 2013-03-01 2015-12-09 纽昂斯通讯公司 虚拟医疗助理方法和装置
US9332410B2 (en) 2012-08-21 2016-05-03 Huawei Device Co., Ltd. Method, apparatus, and terminal for answering call
CN105740686A (zh) * 2016-01-28 2016-07-06 百度在线网络技术(北京)有限公司 应用的控制方法和装置
CN106023994A (zh) * 2016-04-29 2016-10-12 杭州华橙网络科技有限公司 一种语音处理的方法、装置以及系统
CN106156583A (zh) * 2016-06-03 2016-11-23 深圳市金立通信设备有限公司 一种语音解锁的方法及终端
CN106371905A (zh) * 2016-08-29 2017-02-01 北京奇点机智信息技术有限公司 应用程序操作方法、装置和服务器
CN106663430A (zh) * 2014-09-08 2017-05-10 高通股份有限公司 使用用户指定关键词的说话者不相依关键词模型的关键词检测
CN106796497A (zh) * 2014-09-12 2017-05-31 苹果公司 用于始终监听语音触发的动态阈值
CN106789957A (zh) * 2016-11-30 2017-05-31 无锡小天鹅股份有限公司 洗衣应用的语音登录方法及其智能设备
WO2017128227A1 (zh) * 2016-01-28 2017-08-03 陈学良 一种应用程序的调用方法及移动终端
WO2017128226A1 (zh) * 2016-01-28 2017-08-03 陈学良 通话过程中调用应用程序时的信息推送方法及移动终端
US9767805B2 (en) 2013-11-18 2017-09-19 Lenovo (Beijing) Limited Voice recognition method, voice controlling method, information processing method, and electronic apparatus
CN107222383A (zh) * 2016-03-21 2017-09-29 科大讯飞股份有限公司 一种对话管理方法和系统
CN107391977A (zh) * 2017-07-04 2017-11-24 阿里巴巴集团控股有限公司 权限的控制、自动切换方法、装置及设备
CN107526951A (zh) * 2016-06-21 2017-12-29 深圳市中兴微电子技术有限公司 一种信息发送方法及装置
CN107623794A (zh) * 2017-10-27 2018-01-23 维沃移动通信有限公司 一种语音数据的处理方法、装置及移动终端
US9959129B2 (en) 2015-01-09 2018-05-01 Microsoft Technology Licensing, Llc Headless task completion within digital personal assistants
CN108134870A (zh) * 2017-12-12 2018-06-08 北京小米移动软件有限公司 语音信息发送方法及装置
WO2018148949A1 (en) * 2017-02-17 2018-08-23 Microsoft Technology Licensing, Llc Remote control of applications
CN108694947A (zh) * 2018-06-27 2018-10-23 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
CN105556920B (zh) * 2013-09-16 2018-11-09 高通股份有限公司 用于控制对应用程序的访问的方法和设备
CN108831489A (zh) * 2018-06-21 2018-11-16 四川斐讯信息技术有限公司 一种音箱控制方法及系统
CN108922527A (zh) * 2018-06-28 2018-11-30 西安艾润物联网技术服务有限责任公司 车辆缴费语音控制方法、系统及可读存储介质
CN109076271A (zh) * 2016-03-30 2018-12-21 惠普发展公司,有限责任合伙企业 用于指示个人辅助应用的状态的指示器
CN109379499A (zh) * 2018-11-20 2019-02-22 北京千丁互联科技有限公司 一种语音呼叫方法及装置
US10276168B2 (en) 2014-07-31 2019-04-30 Tencent Technology (Shenzhen) Company Limited Voiceprint verification method and device
CN109801620A (zh) * 2017-11-16 2019-05-24 棣南股份有限公司 文书编辑软件的语音控制方法及语音控制系统
CN109903767A (zh) * 2019-04-02 2019-06-18 广州视源电子科技股份有限公司 一种语音处理方法、装置、设备及系统
CN110021307A (zh) * 2019-04-04 2019-07-16 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备
CN110209476A (zh) * 2019-05-09 2019-09-06 深圳如一探索科技有限公司 一种应用程序中的对象切换方法、装置、电子设备及存储介质
CN110313152A (zh) * 2017-02-14 2019-10-08 微软技术许可有限责任公司 用于智能助理计算机的用户注册
CN110462662A (zh) * 2017-03-29 2019-11-15 三星电子株式会社 使用话语进行支付的设备和方法
WO2020029094A1 (zh) * 2018-08-07 2020-02-13 华为技术有限公司 一种语音控制命令生成方法及终端
CN111341326A (zh) * 2020-02-18 2020-06-26 RealMe重庆移动通信有限公司 语音处理方法及相关产品
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
CN112951243A (zh) * 2021-02-07 2021-06-11 深圳市汇顶科技股份有限公司 语音唤醒方法、装置、芯片、电子设备及存储介质
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11853647B2 (en) 2015-12-23 2023-12-26 Apple Inc. Proactive assistance based on dialog communication between devices
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080172231A1 (en) * 2004-06-16 2008-07-17 Alcatel Lucent Method of Processing Sound Signals for a Communication Terminal and Communication Terminal Using that Method
CN201307938Y (zh) * 2008-09-02 2009-09-09 宇龙计算机通信科技(深圳)有限公司 一种移动终端
CN101715018A (zh) * 2009-11-03 2010-05-26 沈阳晨讯希姆通科技有限公司 手机功能的语音控制方法
CN102223367A (zh) * 2011-06-10 2011-10-19 安徽科大讯飞信息科技股份有限公司 移动用户访问网站的方法、设备及系统
CN102238189A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 声纹密码认证方法及系统
CN102238190A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 身份认证方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080172231A1 (en) * 2004-06-16 2008-07-17 Alcatel Lucent Method of Processing Sound Signals for a Communication Terminal and Communication Terminal Using that Method
CN201307938Y (zh) * 2008-09-02 2009-09-09 宇龙计算机通信科技(深圳)有限公司 一种移动终端
CN101715018A (zh) * 2009-11-03 2010-05-26 沈阳晨讯希姆通科技有限公司 手机功能的语音控制方法
CN102223367A (zh) * 2011-06-10 2011-10-19 安徽科大讯飞信息科技股份有限公司 移动用户访问网站的方法、设备及系统
CN102238189A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 声纹密码认证方法及系统
CN102238190A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 身份认证方法及系统

Cited By (179)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9332410B2 (en) 2012-08-21 2016-05-03 Huawei Device Co., Ltd. Method, apparatus, and terminal for answering call
CN103631519B (zh) * 2012-08-27 2020-12-01 三星电子株式会社 用于提供用户界面的方法和设备
CN103631519A (zh) * 2012-08-27 2014-03-12 三星电子株式会社 用于提供用户界面的方法和设备
CN102938945A (zh) * 2012-10-17 2013-02-20 上海移远通信技术有限公司 无线通讯模块及其控制方法
CN102945669A (zh) * 2012-11-14 2013-02-27 四川长虹电器股份有限公司 一种家电设备语音控制方法
CN103051781A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 语音后台控制方法及移动终端
CN103077721A (zh) * 2012-12-25 2013-05-01 百度在线网络技术(北京)有限公司 移动终端的语音备忘方法及移动终端
CN103077714A (zh) * 2013-01-29 2013-05-01 华为终端有限公司 信息的识别方法和装置
US9390711B2 (en) 2013-01-29 2016-07-12 Huawei Device Co., Ltd. Information recognition method and apparatus
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
CN105144171B (zh) * 2013-03-01 2019-01-18 纽昂斯通讯公司 虚拟医疗助理方法和装置
CN105144171A (zh) * 2013-03-01 2015-12-09 纽昂斯通讯公司 虚拟医疗助理方法和装置
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
CN104995865A (zh) * 2013-03-14 2015-10-21 英特尔公司 基于声音和/或面部辨识的服务提供
CN104995865B (zh) * 2013-03-14 2018-06-08 英特尔公司 基于声音和/或面部辨识的服务提供
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
CN103281446A (zh) * 2013-05-09 2013-09-04 百度在线网络技术(北京)有限公司 语音短信发送系统和方法
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
CN105556920B (zh) * 2013-09-16 2018-11-09 高通股份有限公司 用于控制对应用程序的访问的方法和设备
CN103500578B (zh) * 2013-10-22 2016-05-11 上海云视科技股份有限公司 语音操控方法和装置
CN103500578A (zh) * 2013-10-22 2014-01-08 上海云视科技有限公司 语音操控方法和装置
US9767805B2 (en) 2013-11-18 2017-09-19 Lenovo (Beijing) Limited Voice recognition method, voice controlling method, information processing method, and electronic apparatus
CN104660792A (zh) * 2013-11-21 2015-05-27 腾讯科技(深圳)有限公司 唤醒应用的方法及装置
CN103632667A (zh) * 2013-11-25 2014-03-12 华为技术有限公司 声学模型优化方法、装置及语音唤醒方法、装置和终端
CN103632667B (zh) * 2013-11-25 2017-08-04 华为技术有限公司 声学模型优化方法、装置及语音唤醒方法、装置和终端
WO2015081681A1 (en) * 2013-12-03 2015-06-11 Tencent Technology (Shenzhen) Company Limited Systems and methods for audio command recognition
US10013985B2 (en) 2013-12-03 2018-07-03 Tencent Technology (Shenzhen) Company Limited Systems and methods for audio command recognition with speaker authentication
CN103730120A (zh) * 2013-12-27 2014-04-16 深圳市亚略特生物识别科技有限公司 电子设备的语音控制方法及系统
CN103838991A (zh) * 2014-02-20 2014-06-04 联想(北京)有限公司 一种信息处理方法及电子设备
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US10276168B2 (en) 2014-07-31 2019-04-30 Tencent Technology (Shenzhen) Company Limited Voiceprint verification method and device
CN104168270A (zh) * 2014-07-31 2014-11-26 腾讯科技(深圳)有限公司 身份验证方法、服务器、客户端及系统
CN104282307A (zh) * 2014-09-05 2015-01-14 中兴通讯股份有限公司 唤醒语音控制系统的方法、装置及终端
CN106663430B (zh) * 2014-09-08 2021-02-26 高通股份有限公司 使用用户指定关键词的说话者不相依关键词模型的关键词检测
CN106663430A (zh) * 2014-09-08 2017-05-10 高通股份有限公司 使用用户指定关键词的说话者不相依关键词模型的关键词检测
CN106796497B (zh) * 2014-09-12 2020-10-30 苹果公司 用于始终监听语音触发的动态阈值
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
CN106796497A (zh) * 2014-09-12 2017-05-31 苹果公司 用于始终监听语音触发的动态阈值
CN104506901B (zh) * 2014-11-12 2018-06-15 科大讯飞股份有限公司 基于电视场景状态及语音助手的语音辅助方法及系统
CN104506901A (zh) * 2014-11-12 2015-04-08 科大讯飞股份有限公司 基于电视场景状态及语音助手的语音辅助方法及系统
US9959129B2 (en) 2015-01-09 2018-05-01 Microsoft Technology Licensing, Llc Headless task completion within digital personal assistants
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US10204618B2 (en) 2015-04-13 2019-02-12 Hisense Mobile Communications Technology Co., Ltd. Terminal and method for voice control on terminal
CN104902070A (zh) * 2015-04-13 2015-09-09 青岛海信移动通信技术股份有限公司 一种移动终端语音控制的方法及移动终端
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
CN104834531A (zh) * 2015-05-29 2015-08-12 中山大学 一种盲人计算机的命令匹配系统及其实现方法
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US11853647B2 (en) 2015-12-23 2023-12-26 Apple Inc. Proactive assistance based on dialog communication between devices
WO2017128226A1 (zh) * 2016-01-28 2017-08-03 陈学良 通话过程中调用应用程序时的信息推送方法及移动终端
CN105740686B (zh) * 2016-01-28 2019-04-23 百度在线网络技术(北京)有限公司 应用的控制方法和装置
WO2017128227A1 (zh) * 2016-01-28 2017-08-03 陈学良 一种应用程序的调用方法及移动终端
CN105740686A (zh) * 2016-01-28 2016-07-06 百度在线网络技术(北京)有限公司 应用的控制方法和装置
CN107222383A (zh) * 2016-03-21 2017-09-29 科大讯飞股份有限公司 一种对话管理方法和系统
CN107222383B (zh) * 2016-03-21 2021-05-04 清华大学 一种对话管理方法和系统
CN109076271B (zh) * 2016-03-30 2021-08-03 惠普发展公司,有限责任合伙企业 用于指示个人辅助应用的状态的指示器
US10580266B2 (en) 2016-03-30 2020-03-03 Hewlett-Packard Development Company, L.P. Indicator to indicate a state of a personal assistant application
CN109076271A (zh) * 2016-03-30 2018-12-21 惠普发展公司,有限责任合伙企业 用于指示个人辅助应用的状态的指示器
CN106023994A (zh) * 2016-04-29 2016-10-12 杭州华橙网络科技有限公司 一种语音处理的方法、装置以及系统
CN106156583A (zh) * 2016-06-03 2016-11-23 深圳市金立通信设备有限公司 一种语音解锁的方法及终端
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
CN107526951A (zh) * 2016-06-21 2017-12-29 深圳市中兴微电子技术有限公司 一种信息发送方法及装置
CN106371905A (zh) * 2016-08-29 2017-02-01 北京奇点机智信息技术有限公司 应用程序操作方法、装置和服务器
CN106371905B (zh) * 2016-08-29 2019-12-17 北京奇点机智信息技术有限公司 应用程序操作方法、装置和服务器
CN106789957A (zh) * 2016-11-30 2017-05-31 无锡小天鹅股份有限公司 洗衣应用的语音登录方法及其智能设备
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
CN110313152B (zh) * 2017-02-14 2021-10-22 微软技术许可有限责任公司 用于智能助理计算机的用户注册
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
CN110313152A (zh) * 2017-02-14 2019-10-08 微软技术许可有限责任公司 用于智能助理计算机的用户注册
WO2018148949A1 (en) * 2017-02-17 2018-08-23 Microsoft Technology Licensing, Llc Remote control of applications
US11507191B2 (en) 2017-02-17 2022-11-22 Microsoft Technology Licensing, Llc Remote control of applications
CN109154863A (zh) * 2017-02-17 2019-01-04 微软技术许可有限责任公司 应用的远程控制
CN109154863B (zh) * 2017-02-17 2022-01-04 微软技术许可有限责任公司 应用的远程控制方法及装置
CN110462662B (zh) * 2017-03-29 2023-01-03 三星电子株式会社 使用话语进行支付的设备和方法
CN110462662A (zh) * 2017-03-29 2019-11-15 三星电子株式会社 使用话语进行支付的设备和方法
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
CN107391977A (zh) * 2017-07-04 2017-11-24 阿里巴巴集团控股有限公司 权限的控制、自动切换方法、装置及设备
CN107623794A (zh) * 2017-10-27 2018-01-23 维沃移动通信有限公司 一种语音数据的处理方法、装置及移动终端
CN109801620A (zh) * 2017-11-16 2019-05-24 棣南股份有限公司 文书编辑软件的语音控制方法及语音控制系统
CN108134870A (zh) * 2017-12-12 2018-06-08 北京小米移动软件有限公司 语音信息发送方法及装置
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
CN108831489A (zh) * 2018-06-21 2018-11-16 四川斐讯信息技术有限公司 一种音箱控制方法及系统
WO2020001165A1 (zh) * 2018-06-27 2020-01-02 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
CN108694947B (zh) * 2018-06-27 2020-06-19 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
CN108694947A (zh) * 2018-06-27 2018-10-23 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
CN108922527A (zh) * 2018-06-28 2018-11-30 西安艾润物联网技术服务有限责任公司 车辆缴费语音控制方法、系统及可读存储介质
JP2021532500A (ja) * 2018-08-07 2021-11-25 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 音声制御コマンド生成方法および端末
WO2020029094A1 (zh) * 2018-08-07 2020-02-13 华为技术有限公司 一种语音控制命令生成方法及终端
CN111742539B (zh) * 2018-08-07 2022-05-06 华为技术有限公司 一种语音控制命令生成方法及终端
US11848016B2 (en) 2018-08-07 2023-12-19 Huawei Technologies Co., Ltd. Voice control command generation method and terminal
CN111742539A (zh) * 2018-08-07 2020-10-02 华为技术有限公司 一种语音控制命令生成方法及终端
JP7173670B2 (ja) 2018-08-07 2022-11-16 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 音声制御コマンド生成方法および端末
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
CN109379499A (zh) * 2018-11-20 2019-02-22 北京千丁互联科技有限公司 一种语音呼叫方法及装置
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
CN109903767A (zh) * 2019-04-02 2019-06-18 广州视源电子科技股份有限公司 一种语音处理方法、装置、设备及系统
CN109903767B (zh) * 2019-04-02 2021-10-22 广州视源电子科技股份有限公司 一种语音处理方法、装置、设备及系统
CN110021307A (zh) * 2019-04-04 2019-07-16 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
CN110209476A (zh) * 2019-05-09 2019-09-06 深圳如一探索科技有限公司 一种应用程序中的对象切换方法、装置、电子设备及存储介质
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
CN111341326B (zh) * 2020-02-18 2023-04-18 RealMe重庆移动通信有限公司 语音处理方法及相关产品
CN111341326A (zh) * 2020-02-18 2020-06-26 RealMe重庆移动通信有限公司 语音处理方法及相关产品
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
CN112951243A (zh) * 2021-02-07 2021-06-11 深圳市汇顶科技股份有限公司 语音唤醒方法、装置、芯片、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN102510426A (zh) 个人助理应用访问方法及系统
CN107395352B (zh) 基于声纹的身份识别方法及装置
KR102100976B1 (ko) 스택 데이터 구조 백그라운드의 디지털 어시스턴트 프로세싱
CN104185868B (zh) 话音认证和语音识别系统及方法
WO2017012496A1 (zh) 一种用户声纹模型构建方法、装置及系统
JP6096333B2 (ja) 決済を検証するための方法、装置、およびシステム
JP6099556B2 (ja) 音声識別方法および装置
CN101467204B (zh) 用于生物计量声纹认证的方法和系统
US9047868B1 (en) Language model data collection
CN104834847B (zh) 身份验证方法及装置
CN106506524A (zh) 用于验证用户的方法和装置
CN108305626A (zh) 应用程序的语音控制方法和装置
CN111223485A (zh) 智能交互方法、装置、电子设备及存储介质
CN106663430A (zh) 使用用户指定关键词的说话者不相依关键词模型的关键词检测
CN106796785A (zh) 用于产生声音检测模型的声音样本验证
CN105556920A (zh) 用于控制对应用程序的访问的方法和设备
CN102413100A (zh) 声纹密码图片提示的声纹认证系统及其实现方法
CN104104664A (zh) 对验证码进行验证的方法、服务器、客户端和系统
CN109101801B (zh) 用于身份认证的方法、装置、设备和计算机可读存储介质
CN102223367A (zh) 移动用户访问网站的方法、设备及系统
US11757870B1 (en) Bi-directional voice authentication
CN104158664A (zh) 一种身份认证方法及系统
CN105469789A (zh) 一种语音信息的处理方法及终端
CN102299934A (zh) 一种基于云模式和语音识别的语音输入方法
CN106341539A (zh) 恶意来电者声纹的自动取证方法、装置和移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120620