CN104575504A - 采用声纹和语音识别进行个性化电视语音唤醒的方法 - Google Patents

采用声纹和语音识别进行个性化电视语音唤醒的方法 Download PDF

Info

Publication number
CN104575504A
CN104575504A CN201410840544.9A CN201410840544A CN104575504A CN 104575504 A CN104575504 A CN 104575504A CN 201410840544 A CN201410840544 A CN 201410840544A CN 104575504 A CN104575504 A CN 104575504A
Authority
CN
China
Prior art keywords
voice
user
television
wake
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410840544.9A
Other languages
English (en)
Inventor
龙艳花
叶宏
魏浩然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Normal University
University of Shanghai for Science and Technology
Original Assignee
Shanghai Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Normal University filed Critical Shanghai Normal University
Priority to CN201410840544.9A priority Critical patent/CN104575504A/zh
Publication of CN104575504A publication Critical patent/CN104575504A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明采用声纹和语音识别进行个性化电视语音唤醒的方法,具体指一种通过声纹识别进行电视机使用用户的身份确认,并通过确认的身份和对用户语音的语音识别结果来控制电视机进行个性化的语音唤醒,涉及声纹识别和语音识别技术。本发明构成系统包括语音控制系统(1),信息存储单元(2)和电视机主控制器(3)以电信号方式连接组成。本发明具有训练时间短,声纹和语音识别速度都很快,且识别率高的特点。声纹和语音识别均仅需离线训练和测试就可完成,无需发送到云端服务器,使用方便且保证了家庭信息的安全性。还可应用于电视机的用户个性化自动语音换台,同时可被移植到通用的DSP高速处理器或芯片上运行,能广泛应用于智能家居相关领域。

Description

采用声纹和语音识别进行个性化电视语音唤醒的方法
技术领域
本发明涉及声纹识别和语音识别技术,通过声纹识别进行电视机使用用户的身份确认,并通过确认的身份和对用户语音的语音识别结果来控制电视机进行个性化的语音唤醒。
背景技术
近年来,随着智能语音处理技术、互联网和云计算技术的快速发展,目前市面上出现的智能电视大部分都开始支持简单的语音操作,如进行音量调节,资源搜索等,同时电视语音助手等应用也开始出现。但由于中国各地的方言种类多、同音字多、各地方言的语音语调的不同、周围环境噪声等因素造成语音识别的准确率很低,电视无法执行用户语音命令的现象时常出现。因此,对消费者来说,目前的语音电视在一定程度上并不能满足其各项需求。同时,这些人机语音交互功能大多需要通过云端计算来完成,存在一定的安全隐患。
现在几乎每个家庭都拥有一台或几台电视机,但一台电视通常会被几位家庭成员使用,特别是放置在客厅的电视,而每位家庭成员对电视节目频道的喜好却不尽相同,这时在打开电视后通常需要用遥控器对电视节目频道进行遍历切换以找到自己最喜欢的频道,非常不方便且繁琐。
发明内容
为解决现有技术的不足,本发明提供一种采用语音进行个性化电视唤醒的实现方法,能够对用户语音采用声纹识别和语音识别,实现对用户的身份进行监测并使用非常简单的唤醒词就能唤醒电视打开其最喜欢的电视频道。
众所周知,声纹识别又称说话人识别,是生物识别技术的一种,声纹识别和语音识别均属于智能语音处理技术的范畴。具体是将说话人语音信号中的声纹特征参数与训练好的声纹模型进行模式匹配从而自动进行说话人身份确认或辨认的技术。语音识别是通过模式识别和语言理解将语音信号中包含的文字信息提取出来的技术,主要包括特征提取、声学模型和语言模型训练、解码技术等。
本发明具体实现步骤如下:
A.个性化信息注册
采用声纹识别系统建立用户的声纹模型,采用语音识别系统识别出用户最喜爱的电视频道信息。
B.信息存储
将用户声纹模型和最喜爱的电视频道信息进行关联并存储到电视机信息存储单元。
C.语音唤醒
用户只需对电视机的语音采集单元说出预先设定的唤醒词,即可根据声纹识别和语音识别系统对唤醒词的声纹和语音识别结果从电视机信息存储单元中调出用户的个性化信息,自动完成打开电视并自动切换到用户最喜爱的电视频道。
以上所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特点是,所述步骤A、步骤B,在用户作第一次操作时完成,以后只需操作步骤C,即可完成其个性化语音电视的唤醒。
当用户对电视频道的喜好发生改变时,通过重新执行步骤A,进行用户个性化信息注册,对信息存储单元中的电视频道信息进行更新,此时无需进行声纹建模,仅需进行声纹匹配和语音识别。
由于本发明使用了声纹识别技术,很容易对不同用户建立起其对应的声纹密钥(声纹模型),通过不同用户声纹密钥的唯一性实现对其喜爱的电视频道信息进行关联和保护,进而实现具有用户个性化的电视语音唤醒功能。
本发明与现有技术相比,具有以下特点:
第一、用户只需张嘴说简单的唤醒词,如“hello电视”就能自动打开电视并立即切换到自己最喜欢的电视台节目频道,无需再手动开机遥控,给用户带来智能、时尚的应用体验。
第二、个性化注册时的声纹识别性能与所说的文本和使用的语言无关,方便使用。
第三、用声纹作为密码,简单的电视频道代码和唤醒词语音作为交互方式,因此语音识别系统仅需实现简单的关键词识别即可,识别速度快,且声纹识别和语音识别仅需离线训练和测试就可完成,无需发送到云端服务器,使用方便且保证了家庭信息的安全性。
第四、可设置多位用户的个性化语音开机信息,除唤醒功能外,同时也可用于个性化自动语音换台。
第五、本发明的算法实现模块具有很好的可移植性和可扩展性,可被移植到有线电视的机顶盒、通用的DSP高速处理器或芯片上运行,能广泛应用于智能家居相关领域。
附图说明
图1为本发明采用声纹和语音识别进行个性化电视语音唤醒的方法系统组成框图;
图2为本发明实施例用户个性化信息注册系统流程图;
图3为本发明实施例个性化语音唤醒电视的流程图。
具体实施方式
以下结合附图和实施例对本发明作进一步的描述
本发明构建了一套采用声纹和语音识别进行个性化电视语音唤醒的系统(如图1所示),该系统包括用于用户个性化信息注册、唤醒词识别和声纹匹配的语音控制系统1,用于接收并存储从语音控制系统1中传递来的已训练好的用户声纹模型和已识别出的电视频道信息的信息存储单元2和接收从语音控制系统1和信息存储单元中传递的控制信息,负责执行个性化电视语音唤醒操作的电视机主控制器3组成,以电信号方式连接。其中:
所述语音控制系统1由语音采集单元11,语音识别单元12和声纹识别单元13组成,其中:
所述语音采集单元11用于完成用户语音信号的采集和处理;
所述语音识别单元12用于识别用户所说的电视频道信息和唤醒词;
所述声纹识别单元13用于从用户语音中提取出代表其身份信息的声纹信息进行声纹建模和声纹匹配。
本发明的语音控制系统有二个状态按钮,即“用户注册”和“语音唤醒”。当用户需要进行个性化信息注册时开启“用户注册”,平时均处于“语音唤醒”状态,这样有利于节省电能。
下面结合附图分别介绍用户个性化信息注册过程和自动语音唤醒的具体实施方式
用户首次进行个性化信息注册时(如图2所示)实施例,需对电视机说话二次,第一次为任意文本的语音,用于声纹建模,第二次为用户自己最喜欢的电视频道信息,用于将电视频道信息与用户声纹模型进行关联。具体步骤如下:
A1.开启语音控制系1,使其处于“用户注册”状态;
A2.若用户为首次进行个性化信息注册,执行该步骤,否则转向步骤A6开始执行,用户对着电视机的语音采集单元11说话,说话内容为任意文本,持续时间至少30秒;
A3.语音采集单元11采集输入的说话人语音信号,并对其进行A/D转换,滤波处理;
A4.声纹识别单元13对经步骤A3处理后的语音信号作预处理,包括加窗分帧、预加重、端点检测,提取声纹特征参数,然后调用信息存储单元2中已有的声纹模型进行声纹匹配,若匹配成功,转向步骤A7;反之,进入下一步操作;
A5.调用声纹识别单元13对从步骤A4中提取的特征参数进行声纹模型的训练,将训练好的声纹模型存储到信息存储单2;
A6.用户对着电视机的语音采集单元11说出自己最喜欢的电视频道信息,如频道代码“3”代表湖南卫视,则说出数字“3”,转向步骤A3重新开始;
A7.语音识别单元12对语音采集单元11采集到的语音进行识别,将识别出的电视频道代码存储到信息存储单元2中并与声纹匹配成功的声纹模型进行关联;
A8.退出个性化信息注册。
当用户的电视频道喜好发生改变时,可通过重新进行个性化信息注册来更新信息存储单元2中的电视频道信息,此时只需对着电视机的语音采集单元11说出电视频道信息即可,语音控制系统1会自动从上述的步骤A6开始执行,无需对用户声纹重新建模。
自动进行个性化语音唤醒电视(如图3所示)实施例的具体步骤如下:
C1.当语音控制系统1处于“语音唤醒”开启状态时,用户对着电视机语音采集单元11说出唤醒词;
C2.语音采集单元11采集输入的说话人语音信号,并对其进行A/D转换,滤波处理;
C3.语音识别单元12对上述处理过的语音进行识别,将识别出的内容与预先设定的唤醒词进行匹配,以判断采集到的输入语音信号是否为电视机的语音唤醒指令,若匹配成功则将唤醒操作指令传递给电视机主控制器3,否则退出唤醒系统;
C4.声纹识别单元13将处理过的语音与信息存储单元2中的声纹模型进行声纹匹配,若匹配成功,则将与用户声纹模型关联的电视频道信息和唤醒操作指令输出给电视机主控制器3,否则退出唤醒系统;
C5.电视机主控制器3在成功收到语音控制系统1传递来的电视频道信息和唤醒操作指令后,执行电视开机操作并自动切换到对应用户喜爱的电视频道上。
上述提到的预先设定的特定语音唤醒词可为任意设定的词组,如“打开电视机”、“开电视”、“打开电视”、“hello电视”、“hello TV”等等。语音采集单元11可为麦克风或其他语音采集设备,用于感知周边的语音信号。
本发明涉及到的声纹识别单元13所采用的识别算法为基于总变化因子(又称为i-Vector)的说话人确认方法,其具体构建步骤如下:
一、语音信号的预处理
语音信号的预处理包括对语音信号进行预加重、加窗分帧和端点检测。对于经过A/D转换后的数字语音信号,预加重使用如下的一阶数字滤波器来提升语音信号的高频分量:
H(z)=1-0.97z-1
然后采用如下式的汉明窗窗函数对语音信号进行平滑,并在加窗过程中进行语音信号的分帧操作,其中N为窗的长度。
W(n)=0.54+0.46cos[2πn/(N-1)]
对于采样率为8000Hz的语音,分帧时使用的帧长为25毫秒,帧移为10毫秒。本发明采用的是基于短时能量的端点检测法对语音信号进行端点检测,从而判断语音信号的起始点和终止点,设x(·)为通过预加重后的语音信号,则表示从语音信号的第n个点开始加窗时的短时能量En计算公式为:
E n = Σ m = - ∞ ∞ [ x ( m ) W ( n - m ) 2 = x 2 ( n ) * W 2 ( n )
二、声纹特征参数的提取
声纹特征参数的提取即从说话人的语音信号中提取出能反映其身份个性的参数。本发明使用的是39维的感知线性预测系数(Perception LinearPredictive Coefficients,PLP),具体提取过程为:首先对上述步骤一预处理过后的语音做短时快速傅里叶变换,然后使用24阶子带的梅尔三角滤波器组进行临界频率分析,接着对得到的语音能量谱进行等响度曲线预加重用以模拟人耳的听觉感知系统对频率的敏感度,即将能量谱用如下式中的等响度曲线进行加权。
E ( ω ) = ( ω 2 + 56.8 × 10 6 ) ω 4 ( ω 2 + 6.3 × 10 6 ) 2 ( ω 2 + 0.38 × 10 9 ) ( ω 6 + 9.58 × 10 26 )
然后使用指数为1/15的幂函数对能量进行压缩,接下来做离散傅里叶反变换,用dubin算法计算M阶全极点模型,最后对得到的模型系数进一步转换为倒谱系数得到PLP特征参数。根据端点检测结果对采集到的信号中为语音信号之外的信号,如噪声或静音帧对应的特征参数直接丢弃。
三、声纹模型训练
本发明中的用户声纹模型训练采用的是总变化因子建模技术,该技术的目标在于对语音信号中含有的说话人身份信息和周围环境噪声、麦克风传输等信道信息变化空间进行同时建模。给定一段用户的语音,经过上述步骤一和二的处理后,其与说话人及信道相关的高斯混合模型GMM的均值超向量S表示如下:
S=m+Tv+ε
其中m为通用背景模型的均值超向量,T矩阵为总变化空间,ε表示残差,v矢量是与当前目标说话人(用户)及信道相关的总变化因子,它是一个低维矢量,代表着当前说话人的身份信息,即用户的声纹模型。ε和v均服从高斯分布:
ε~N(0,I)
v~N(0,∑)
其中Σ为对角协方差矩阵。对于本发明而言,为了得到v,需要事先采用与电视机语音唤醒场景近似的语音数据集合,利用期望最大化算法(EM)训练得到通用背景模型,得出总变化空间和残差向量。对于任意电视用户的语音,就可利用已训练好的T,ε和m以及由用户语音构建的高斯混合模型S,求出每个用户的总变化因子,即声纹模型。
四、声纹匹配
本发明使用的基于总变化因子的声纹识别系统中,采用两个总变化因子v1和v2之间的余弦距离来度量两段语音中所含说话人声纹信息的匹配程度,其公式如下:
d ( v 1 , v 2 ) = ⟨ v 1 , v 2 ⟩ | | v 1 | | · | | v 2 | |
如果d值大于预先设定的门限值则认为这两段语音来自同一个说话人,声纹匹配成功,否则匹配失败。有研究结果显示,通过概率线性判别分析规整后的总变化因子的鉴别能力更强,可进一步提升声纹识别的性能,但由于本发明主要适用于家庭的电视唤醒,家庭成员数目并不多,一般为1到7之间,因此上述基于总变化因子的声纹识别算法已足以保证本发明在声纹识别方面的准确率。
下面介绍本发明中涉及到的语音识别单元所采用的语音识别算法
由于本发明主要用于电视唤醒和频道切换,用户使用时涉及到的唤醒词和用于表示电视频道信息的词语数量都非常少,因此语音识别单元中采用的语音识别算法只需一套简单的基于GMM-HMM(基于高斯混合模型的隐马尔可夫模型)识别系统即可,且训练和识别过程均采用离线方法,这样能够大大提高语音识别的速度。构建一套GMM-HMM语音识别系统主要包括声学特征参数的提取,声学模型和语言模型训练,语音解码过程。具体实现步骤如下:
一、声学特征参数的提取
由于感知线性预测系数中同时含有说话人的身份信息和语义信息,因此上述介绍的声纹识别算法中的PLP参数提取方法同样用于语音识别,但PLP参数的维数为52维,同时为了增强声学特征的区分能力,需要将52维的PLP参数进行异方差线性判别分析(Heteroscedastic Linear Discriminant Analysis,HLDA)后再用于声学模型建模和解码。
二、声学模型训练
声学模型的训练采用最大似然估计准则,需要用到期望最大化算法EM和Baum-Welch算法,前者用来处理隐马尔可夫模型中由状态序列隐变量带来的不完全数据下的训练问题,而后者用于从训练数据中高效的累积统计量,从而有效抽取模型参数更新所需要的信息。对于本发明的应用,在进行声学模型训练时,隐马尔可夫模型的状态数取5,每个状态使用一个含8个混合高斯成分的GMM模型表示,第j状态的高斯混合密度表达式如下:
b j ( x ) = Σ m = 1 M c jm p jm ( x )
其中 Σ m = 1 M c jm = 1 , c jm ≥ 0
p jm ( x ) = 1 ( 2 π ) D / 2 | Σ jm | 1 / 2 exp { - 1 2 ( x - μ jm ) T Σ jm - 1 ( x - μ jm ) }
M=8表示高斯混合数目,x为任意语音帧的特征参数,D为特征的维数,cjm,μjm和Σjm为第j状态的GMM模型中第m个高斯分量的权重,均值向量和协方差矩阵。
三、语言模型训练
目前主流语音识别所用到的语言模型绝大部分是n-元(n-gram)统计语言模型,是将词串的生成过程表示为一个词间跳转的n-1阶马尔可夫过程。训练和评价n-gram语言模型的指标为下式的模型复杂度(Perplexity):
H = - min K → ∞ 1 K log 2 ( P ( w 1 , . . . , w K ) ) ≈ - 1 K Σ k = 1 K log 2 ( P ( w k | w k - 1 , w k - 2 , . . . , w k - N + ! ) )
其中w1,…,wK为含有K个词的词序列,N为语言模型的元数,本发明中取值为2。从理论上来看,语言模型对词串的期望复杂度应尽可能小,这表示语言模型在对给定的历史词串进行当前词预测时,能拥有更高的确信度。实际上语言模型的训练准则就是使其对训练集合中句子的复杂度最小化。
四、语音解码
在给定声学模型和语言模型的情况下,解码器的好坏与语音识别的速度直接相关,从而直接决定了用户的体验。虽然本发明用来唤醒电视所用的词语有限,由它们构成的解码网络并不大,但本发明仍然推荐采用基于加权有限状态转换(WFST)的Viterbi解码技术,它可以将声学、语言模型和发音字典进行有效的整合,对输入的语音信号PLP特征参数在词网络中进行搜索和匹配,从而找到统计意义上最匹配的词串作为最终的识别结果。
上述语音识别单元中的声学模型和语言模型均可采用目前主流的开源工具HTK或者Kaldi提前训练好并存储起来,在进行语音唤醒时,仅需调用存储好的声学和语言模型,离线对采集到的用户语音进行PLP特征参数提取和解码即可。实验证明,本发明方法具有训练时间短,声纹和语音识别速度都很快,且识别率高的特点。声纹和语音识别均仅需离线训练和测试就可完成,无需发送到云端服务器,使用方便且保证了家庭信息的安全性。另外,本发明在电视关机时,电视整体处于掉电状态,即电视机主控制器、语音识别单元、声纹识别单元、信息存储单元均断电,只有语音采集单元实时采集用户的语音信号消耗电能,而该模块耗电非常少,大大节省了电能消耗。
综上所述,本发明提供的基于声纹识别和语音识别进行个性化电视语音唤醒的实现方法,能够在电视处于关机状态时,用户直接说类似于“hello电视”这样的唤醒词,电视机就可以实现直接开机并立即显示自己最喜爱的电视频道。本发明的实现方法还可应用于电视机的用户个性化自动语音换台,同时可被移植到通用的DSP高速处理器或芯片上运行,能广泛应用于智能家居相关领域。

Claims (11)

1.一种采用声纹和语音识别进行个性化电视语音唤醒的方法,通过采用声纹识别和语音识别系统,对用户的身份进行监测,实现个性化电视语音唤醒,其特征在于,包括如下步骤:
A.个性化信息注册
采用声纹识别系统建立用户的声纹模型,采用语音识别系统识别出用户最喜爱的电视频道信息;
B.信息存储
将用户声纹模型和最喜爱的电视频道信息进行关联并存储到电视机信息存储单元;
C.语音唤醒
用户只需对电视机的语音采集单元说出预先设定的唤醒词,即可根据声纹识别和语音识别系统对唤醒词的声纹和语音识别结果从电视机信息存储单元中调出用户的个性化信息,自动完成打开电视并自动切换到用户最喜爱的电视频道。
2.如权利要求1所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特征在于,所述步骤A、步骤B,在用户作第一次操作时完成,以后只需操作步骤C,即可完成其个性化语音电视的唤醒;
当用户对电视频道的喜好发生改变时,通过重新执行步骤A,进行用户个性化信息注册,对信息存储单元中的电视频道信息进行更新,此时无需进行声纹建模,仅需进行声纹匹配和语音识别。
3.如权利要求1所述的采用声纹和语音识别进行个性化电视语音唤醒的方法的系统,其特征在于,所述系统包括用于用户个性化信息注册、唤醒词识别和声纹匹配的语音控制系统(1),用于接收并存储从语音控制系统(1)中传递来的已训练好的用户声纹模型和已识别出的电视频道信息的信息存储单元(2)和接收从语音控制系统(1)和信息存储单元中传递的控制信息,负责执行个性化电视语音唤醒操作的电视机主控制器(3)组成,以电信号方式连接,其中:
所述语音控制系统(1)由语音采集单元(11),语音识别单元(12)和声纹识别单元(13)组成,其中:
所述语音采集单元(11)用于完成用户语音信号的采集和处理;
所述语音识别单元(12)用于识别用户所说的电视频道信息和唤醒词;
所述声纹识别单元(13)用于从用户语音中提取出代表其身份信息的声纹信息进行声纹建模和声纹匹配。
4.如权利要求1所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特征在于,所述步骤A个性化信息注册,具体实现步骤为:
A1.开启语音控制系统(1),使其处于“用户注册”状态;
A2.若用户为首次进行个性化信息注册,执行该步骤,否则转向步骤A6开始执行,用户对着电视机的语音采集单元(11)说话,说话内容为任意文本,持续时间至少30秒;
A3.语音采集单元(11)采集输入的说话人语音信号,并对其进行A/D转换,滤波处理;
A4.声纹识别单元(13)对经步骤A3处理后的语音信号作预处理,包括加窗分帧、预加重、端点检测,提取声纹特征参数,然后调用信息存储单元(2)中已有的声纹模型进行声纹匹配,若匹配成功,转向步骤A7;反之,进入下一步操作;
A5.调用声纹识别单元(13)对从步骤A4中提取的特征参数进行声纹模型的训练,将训练好的声纹模型存储到信息存储单元(2);
A6.用户对着电视机的语音采集单元(11)说出自己最喜欢的电视频道信息,如频道代码“3”代表湖南卫视,则说出数字“3”,转向步骤A3重新开始;
A7.语音识别单元(12)对语音采集单元(11)采集到的语音进行识别,将识别出的电视频道代码存储到信息存储单元(2)中并与声纹匹配成功的声纹模型进行关联;
A8.退出个性化信息注册。
5.如权利要求1所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特征在于,所述步骤C语音唤醒,具体实现步骤为:
C1.当语音控制系统(1)处于“语音唤醒”开启状态时,用户对着电视机语音采集单元(11)说出唤醒词;
C2.语音采集单元(11)采集输入的说话人语音信号,并对其进行A/D转换,滤波处理;
C3.语音识别单元(12)对上述处理过的语音进行识别,将识别出的内容与预先设定的唤醒词进行匹配,以判断采集到的输入语音信号是否为电视机的语音唤醒指令,若匹配成功则将唤醒操作指令传递给电视机主控制器(3),否则退出唤醒系统;
C4.声纹识别单元(13)将处理过的语音与信息存储单元(2)中的声纹模型进行声纹匹配,若匹配成功,则将与用户声纹模型关联的电视频道信息和唤醒操作指令输出给电视机主控制器(3),否则退出唤醒系统;
C5.电视机主控制器(3)在成功收到语音控制系统(1)传递来的电视频道信息和唤醒操作指令后,执行电视开机操作并自动切换到对应用户喜爱的电视频道上。
6.如权利要求4所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特征在于,所述步骤A5中的声纹模型的训练方法为总变化因子建模技术。
7.如权利要求6所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特征在于,所述总变化因子建模技术,给定一段用户的语音,与说话人及信道相关的高斯混合模型GMM的均值超向量S表示如下:
S=m+Tv+ε
其中,m为通用背景模型的均值超向量,T矩阵为总变化空间,ε为残差,v矢量是与当前目标说话人(用户)及信道相关的总变化因子,它代表着当前说话人的身份信息,即用户的声纹模型。
8.如权利要求7所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特征在于,所述ε和v均服从高斯分布:
ε~N(0,I)
v~N(0,Σ)
其中,Σ为对角协方差矩阵,为得到v,需要事先采用与电视机语音唤醒场景近似的语音数据集合,利用期望最大化算法训练得到通用背景模型,得出总变化空间和残差向量;对于任意电视用户的语音,就可利用已训练好的T,ε和m以及由用户语音构建的高斯混合模型S,求出每个用户的总变化因子,即声纹模型。
9.如权利要求4,5所述的采用声纹和语音识别进行个性化电视语音唤醒的方法,其特征在于,所述声纹匹配,使用的是基于总变化因子的声纹识别系统,采用两个总变化因子v1和v2之间的余弦距离来度量两段语音中所含说话人声纹信息的匹配程度,其公式如下:
d ( v 1 , v 2 ) = < v 1 , v 2 > | | v 1 | | &CenterDot; | | v 2 | |
如果d值大于预先设定的门限值则认为这两段语音来自同一个说话人,声纹匹配成功,否则匹配失败。
10.如权利要求3所述的采用声纹和语音识别进行个性化电视语音唤醒的方法的系统,其特征在于,所述语音识别单元(12)声学模型训练时,隐马尔可夫模型的状态数取5,每个状态使用一个含8个混合高斯成分的高斯混合模型GMM表示。
11.如权利要求3所述的采用声纹和语音识别进行个性化电视语音唤醒的方法的系统,其特征在于,所述语音识别单元(12)的语音解码,采用将声学、语言模型和发音字典进行有效的整合,对输入的语音信号PLP特征参数在词网络中进行搜索和匹配,从而找到统计意义上最匹配的词串作为最终识别结果的基于加权有限状态转换的Viterbi解码。
CN201410840544.9A 2014-12-24 2014-12-24 采用声纹和语音识别进行个性化电视语音唤醒的方法 Pending CN104575504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410840544.9A CN104575504A (zh) 2014-12-24 2014-12-24 采用声纹和语音识别进行个性化电视语音唤醒的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410840544.9A CN104575504A (zh) 2014-12-24 2014-12-24 采用声纹和语音识别进行个性化电视语音唤醒的方法

Publications (1)

Publication Number Publication Date
CN104575504A true CN104575504A (zh) 2015-04-29

Family

ID=53091404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410840544.9A Pending CN104575504A (zh) 2014-12-24 2014-12-24 采用声纹和语音识别进行个性化电视语音唤醒的方法

Country Status (1)

Country Link
CN (1) CN104575504A (zh)

Cited By (157)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104821168A (zh) * 2015-04-30 2015-08-05 北京京东方多媒体科技有限公司 一种语音识别方法及装置
CN105049882A (zh) * 2015-08-28 2015-11-11 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN105141768A (zh) * 2015-08-31 2015-12-09 努比亚技术有限公司 多用户识别方法、装置及移动终端
CN105137768A (zh) * 2015-07-21 2015-12-09 合肥智凯电子科技有限公司 一种可语音操作的智能家居控制系统
CN105206271A (zh) * 2015-08-25 2015-12-30 北京宇音天下科技有限公司 智能设备的语音唤醒方法及实现所述方法的系统
CN105355195A (zh) * 2015-09-25 2016-02-24 小米科技有限责任公司 音频识别方法及装置
CN105374355A (zh) * 2015-12-17 2016-03-02 厦门科牧智能技术有限公司 一种电子坐便器的语音控制、交互系统及方法和电子坐便器
CN105609103A (zh) * 2015-12-18 2016-05-25 合肥寰景信息技术有限公司 一种语音即时识别系统
CN105719650A (zh) * 2016-01-30 2016-06-29 深圳市尔木科技有限责任公司 一种语音识别的方法及系统
CN105791935A (zh) * 2016-05-03 2016-07-20 乐视控股(北京)有限公司 一种电视的控制方法及装置
CN105915988A (zh) * 2016-04-19 2016-08-31 乐视控股(北京)有限公司 进入特定电视桌面的电视机开启方法及其电视机
CN105959806A (zh) * 2016-05-25 2016-09-21 乐视控股(北京)有限公司 节目推荐方法及装置
CN105979376A (zh) * 2015-12-02 2016-09-28 乐视致新电子科技(天津)有限公司 一种推荐方法和装置
CN106098068A (zh) * 2016-06-12 2016-11-09 腾讯科技(深圳)有限公司 一种声纹识别方法和装置
CN106683661A (zh) * 2015-11-05 2017-05-17 阿里巴巴集团控股有限公司 基于语音的角色分离方法及装置
CN106782569A (zh) * 2016-12-06 2017-05-31 深圳增强现实技术有限公司 一种基于声纹注册的增强现实方法及装置
CN106782537A (zh) * 2016-12-27 2017-05-31 深圳前海勇艺达机器人有限公司 机器人上查询天气的方法与系统
WO2017092189A1 (zh) * 2015-11-30 2017-06-08 中兴通讯股份有限公司 语音唤醒实现方法、装置及终端、计算机存储介质
CN106847261A (zh) * 2016-12-23 2017-06-13 伟乐视讯科技股份有限公司 一种机顶盒的声纹识别系统及声纹识别方法
CN106886161A (zh) * 2015-12-16 2017-06-23 美的集团股份有限公司 音箱的控制方法、系统及音箱
CN106920546A (zh) * 2015-12-23 2017-07-04 小米科技有限责任公司 智能识别语音的方法及装置
CN107015481A (zh) * 2017-05-31 2017-08-04 苏州远唯景电子科技有限公司 一种带语音身份认证的智能声控窗帘系统
CN107015781A (zh) * 2017-03-28 2017-08-04 联想(北京)有限公司 语音识别方法和系统
CN107147792A (zh) * 2017-05-23 2017-09-08 惠州Tcl移动通信有限公司 一种自动配置音效的方法、装置、移动终端及存储装置
CN107147618A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户注册方法、装置及电子设备
WO2017217978A1 (en) * 2016-06-15 2017-12-21 Nuance Communications, Inc. Techniques for wake-up word recognition and related systems and methods
CN107623614A (zh) * 2017-09-19 2018-01-23 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN107680582A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 声学模型训练方法、语音识别方法、装置、设备及介质
CN107773018A (zh) * 2016-08-29 2018-03-09 佛山市顺德区美的电热电器制造有限公司 偏好烹饪的设置和应用方法、装置及电器
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN108062949A (zh) * 2017-12-11 2018-05-22 广州朗国电子科技有限公司 语音控制跑步机的方法及装置
CN108062464A (zh) * 2017-11-27 2018-05-22 北京传嘉科技有限公司 基于声纹识别的终端控制方法及系统
CN108075892A (zh) * 2016-11-09 2018-05-25 阿里巴巴集团控股有限公司 一种语音处理的方法、装置和设备
CN108156734A (zh) * 2017-12-22 2018-06-12 四川长虹电器股份有限公司 能实现个性化灯光效果的智能家庭灯具系统及控制方法
CN108305623A (zh) * 2018-01-15 2018-07-20 珠海格力电器股份有限公司 电器控制方法及装置
CN108320753A (zh) * 2018-01-22 2018-07-24 珠海格力电器股份有限公司 电器设备的控制方法、装置和系统
CN108604449A (zh) * 2015-09-30 2018-09-28 苹果公司 说话者识别
CN108665895A (zh) * 2018-05-03 2018-10-16 百度在线网络技术(北京)有限公司 用于处理信息的方法、装置和系统
CN108694947A (zh) * 2018-06-27 2018-10-23 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
CN108718419A (zh) * 2018-03-22 2018-10-30 江苏大丰和顺电子有限公司 一种基于声纹锁的电视智能遥控装置及其工作方法
CN108847242A (zh) * 2018-05-30 2018-11-20 Oppo广东移动通信有限公司 电子设备控制方法、装置、存储介质及电子设备
CN108877802A (zh) * 2018-05-29 2018-11-23 康佳集团股份有限公司 一种集成语音唤醒功能的电路、电视和语音控制方法
CN108922538A (zh) * 2018-05-29 2018-11-30 平安科技(深圳)有限公司 会议信息记录方法、装置、计算机设备及存储介质
CN108958810A (zh) * 2018-02-09 2018-12-07 北京猎户星空科技有限公司 一种基于声纹的用户识别方法、装置及设备
CN108986823A (zh) * 2018-09-27 2018-12-11 深圳市易控迪智能家居科技有限公司 一种语音识别解码器及语音操作系统
CN109215646A (zh) * 2018-08-15 2019-01-15 北京百度网讯科技有限公司 语音交互处理方法、装置、计算机设备及存储介质
CN109246473A (zh) * 2018-09-13 2019-01-18 苏州思必驰信息科技有限公司 基于声纹识别的个性化视频弹幕的语音交互方法及终端系统
CN109286832A (zh) * 2017-07-20 2019-01-29 中兴通讯股份有限公司 实现语音操控的方法、装置及机顶盒和计算机可读存储介质
WO2019051668A1 (zh) * 2017-09-13 2019-03-21 深圳传音通讯有限公司 一种智能终端的启动控制方法及启动控制系统
CN109524011A (zh) * 2018-10-22 2019-03-26 四川虹美智能科技有限公司 一种基于声纹识别的冰箱唤醒方法及装置
CN109581881A (zh) * 2018-10-22 2019-04-05 平安科技(深圳)有限公司 智能管家方法、智能管家终端及计算机可读存储介质
CN109712623A (zh) * 2018-12-29 2019-05-03 Tcl通力电子(惠州)有限公司 语音控制方法、装置及计算机可读存储介质
CN109729400A (zh) * 2018-06-27 2019-05-07 平安科技(深圳)有限公司 基于声音的设备控制方法、装置、设备及存储介质
CN109781410A (zh) * 2019-01-22 2019-05-21 北京君林科技股份有限公司 一种声纹识别的轴承故障检测方法及装置
CN109817220A (zh) * 2017-11-17 2019-05-28 阿里巴巴集团控股有限公司 语音识别方法、装置及系统
CN109862408A (zh) * 2018-12-29 2019-06-07 江苏爱仕达电子有限公司 一种用于智能电视语音遥控器的用户语音识别控制方法
CN110047491A (zh) * 2018-01-16 2019-07-23 中国科学院声学研究所 一种随机数字口令相关的说话人识别方法及装置
CN110166821A (zh) * 2019-05-21 2019-08-23 四川虹美智能科技有限公司 一种空调的演示系统及方法
CN110400568A (zh) * 2018-04-20 2019-11-01 比亚迪股份有限公司 智能语音系统的唤醒方法、智能语音系统及车辆
CN110459227A (zh) * 2019-08-29 2019-11-15 四川长虹电器股份有限公司 基于智能电视的声纹注册方法
CN110517696A (zh) * 2019-08-19 2019-11-29 效生软件科技(上海)有限公司 一种可植入式离线声纹识别系统
CN110570857A (zh) * 2019-09-06 2019-12-13 北京声智科技有限公司 语音唤醒方法、装置、电子设备及存储介质
CN111095402A (zh) * 2017-09-11 2020-05-01 瑞典爱立信有限公司 对用户简档的声控管理
CN111107400A (zh) * 2019-12-30 2020-05-05 深圳Tcl数字技术有限公司 数据收集方法、装置、智能电视及计算机可读存储介质
CN111198733A (zh) * 2018-11-19 2020-05-26 阿里巴巴集团控股有限公司 开机画面显示方法、终端设备及存储介质
CN111261158A (zh) * 2020-01-15 2020-06-09 上海思依暄机器人科技股份有限公司 一种功能菜单定制方法、语音快捷控制方法和机器人
WO2020135241A1 (zh) * 2018-12-29 2020-07-02 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
CN111418216A (zh) * 2017-09-29 2020-07-14 搜诺思公司 具有语音辅助的媒体回放系统
CN111429908A (zh) * 2020-03-30 2020-07-17 北京声智科技有限公司 一种智能电子锁控制方法及装置
CN111510778A (zh) * 2019-01-30 2020-08-07 深圳Tcl数字技术有限公司 一种智能电视快速开机方法、系统及可读存储介质
CN111524514A (zh) * 2020-04-22 2020-08-11 海信集团有限公司 一种语音控制方法及中控设备
CN111739513A (zh) * 2020-07-22 2020-10-02 江苏清微智能科技有限公司 自动化语音唤醒测试系统及其测试方法
CN111787380A (zh) * 2020-07-06 2020-10-16 四川长虹网络科技有限责任公司 语音换台控制方法、装置和手持智能终端
WO2020221046A1 (zh) * 2019-04-30 2020-11-05 深圳Tcl新技术有限公司 一种画框电视的横竖屏切换方法及画框电视
CN111956923A (zh) * 2020-09-03 2020-11-20 合肥康居人智能科技有限公司 物联网智能语音控制氧浓度的制氧呼吸一体机监测系统
CN112185362A (zh) * 2020-09-24 2021-01-05 苏州思必驰信息科技有限公司 针对用户个性化服务的语音处理方法及装置
WO2021017978A1 (zh) * 2019-07-26 2021-02-04 深圳Tcl新技术有限公司 一种智能电视语音识别方法、系统及可读存储介质
CN113113026A (zh) * 2021-04-15 2021-07-13 重庆德方信息技术有限公司 基于家庭用户级的声纹身份认证系统和智能检测马桶
CN109584860B (zh) * 2017-09-27 2021-08-03 九阳股份有限公司 一种语音唤醒词定义方法和系统
CN113228170A (zh) * 2019-12-05 2021-08-06 海信视像科技股份有限公司 信息处理装置及非易失性存储介质
US11087750B2 (en) 2013-03-12 2021-08-10 Cerence Operating Company Methods and apparatus for detecting a voice command
CN113421567A (zh) * 2021-08-25 2021-09-21 江西影创信息产业有限公司 基于智能眼镜的终端设备控制方法、系统及智能眼镜
CN113593584A (zh) * 2021-09-27 2021-11-02 深圳市羽翼数码科技有限公司 一种有效抑制响应时间延迟的电子产品语音控制系统
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11184704B2 (en) 2016-02-22 2021-11-23 Sonos, Inc. Music service selection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200889B2 (en) 2018-11-15 2021-12-14 Sonos, Inc. Dilated convolutions and gating for efficient keyword spotting
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
CN113823271A (zh) * 2020-12-18 2021-12-21 京东科技控股股份有限公司 语音分类模型的训练方法、装置、计算机设备及存储介质
US11217256B2 (en) 2018-12-12 2022-01-04 Baidu Online Network Technology (Beijing) Co., Ltd. Voice interaction method, device and terminal
CN113948091A (zh) * 2021-12-20 2022-01-18 山东贝宁电子科技开发有限公司 民航客机陆空通话语音识别引擎及其应用方法
US11295741B2 (en) 2019-12-05 2022-04-05 Soundhound, Inc. Dynamic wakewords for speech-enabled devices
US11302326B2 (en) 2017-09-28 2022-04-12 Sonos, Inc. Tone interference cancellation
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308961B2 (en) 2016-10-19 2022-04-19 Sonos, Inc. Arbitration-based voice recognition
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11354092B2 (en) 2019-07-31 2022-06-07 Sonos, Inc. Noise classification for event detection
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11380322B2 (en) 2017-08-07 2022-07-05 Sonos, Inc. Wake-word detection suppression
US11405430B2 (en) 2016-02-22 2022-08-02 Sonos, Inc. Networked microphone device control
US11432030B2 (en) 2018-09-14 2022-08-30 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11437020B2 (en) 2016-02-10 2022-09-06 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US11451908B2 (en) 2017-12-10 2022-09-20 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US11482978B2 (en) 2018-08-28 2022-10-25 Sonos, Inc. Audio notifications
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11501795B2 (en) 2018-09-29 2022-11-15 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11501773B2 (en) 2019-06-12 2022-11-15 Sonos, Inc. Network microphone device with command keyword conditioning
US11500611B2 (en) 2017-09-08 2022-11-15 Sonos, Inc. Dynamic computation of system response volume
US11514898B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Voice control of a media playback system
US11516610B2 (en) 2016-09-30 2022-11-29 Sonos, Inc. Orientation-based playback device microphone selection
US11513763B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Audio response playback
US11531520B2 (en) 2016-08-05 2022-12-20 Sonos, Inc. Playback device supporting concurrent voice assistants
US11538451B2 (en) 2017-09-28 2022-12-27 Sonos, Inc. Multi-channel acoustic echo cancellation
US11538460B2 (en) 2018-12-13 2022-12-27 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11540047B2 (en) 2018-12-20 2022-12-27 Sonos, Inc. Optimization of network microphone devices using noise classification
US11545169B2 (en) 2016-06-09 2023-01-03 Sonos, Inc. Dynamic player selection for audio signal processing
US11545146B2 (en) 2016-11-10 2023-01-03 Cerence Operating Company Techniques for language independent wake-up word detection
US11551669B2 (en) 2019-07-31 2023-01-10 Sonos, Inc. Locally distributed keyword detection
US11551690B2 (en) 2018-09-14 2023-01-10 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11556306B2 (en) 2016-02-22 2023-01-17 Sonos, Inc. Voice controlled media playback system
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11563842B2 (en) 2018-08-28 2023-01-24 Sonos, Inc. Do not disturb feature for audio notifications
US11641559B2 (en) 2016-09-27 2023-05-02 Sonos, Inc. Audio playback settings for voice interaction
US11646045B2 (en) 2017-09-27 2023-05-09 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US11646023B2 (en) 2019-02-08 2023-05-09 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11664023B2 (en) 2016-07-15 2023-05-30 Sonos, Inc. Voice detection by multiple devices
US11676590B2 (en) 2017-12-11 2023-06-13 Sonos, Inc. Home graph
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11696074B2 (en) 2018-06-28 2023-07-04 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11694689B2 (en) 2020-05-20 2023-07-04 Sonos, Inc. Input detection windowing
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11710487B2 (en) 2019-07-31 2023-07-25 Sonos, Inc. Locally distributed keyword detection
US11715489B2 (en) 2018-05-18 2023-08-01 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US11726742B2 (en) 2016-02-22 2023-08-15 Sonos, Inc. Handling of loss of pairing between networked devices
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11727936B2 (en) 2018-09-25 2023-08-15 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11790937B2 (en) 2018-09-21 2023-10-17 Sonos, Inc. Voice detection optimization using sound metadata
US11792590B2 (en) 2018-05-25 2023-10-17 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11790911B2 (en) 2018-09-28 2023-10-17 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
CN117116263A (zh) * 2023-09-15 2023-11-24 广州易云信息技术有限公司 一种基于语音识别的智能机器人唤醒方法、装置及存储介质
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103442290A (zh) * 2013-08-15 2013-12-11 安徽科大讯飞信息科技股份有限公司 基于电视终端用户及语音的信息提供方法及系统
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN103632669A (zh) * 2012-08-20 2014-03-12 上海闻通信息科技有限公司 一种语音控制遥控器的方法以及一种语音遥控器
CN103646646A (zh) * 2013-11-27 2014-03-19 联想(北京)有限公司 一种语音控制方法及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632669A (zh) * 2012-08-20 2014-03-12 上海闻通信息科技有限公司 一种语音控制遥控器的方法以及一种语音遥控器
CN103442290A (zh) * 2013-08-15 2013-12-11 安徽科大讯飞信息科技股份有限公司 基于电视终端用户及语音的信息提供方法及系统
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN103646646A (zh) * 2013-11-27 2014-03-19 联想(北京)有限公司 一种语音控制方法及电子设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NAJIM DEHAK, ETC: "Support Vector Machines versus Fast Scoring in the Low-Dimensional Total Variability Space for Speaker Verification", <INTERSPEECH2009> *
周毓: "《硕士学位论文》", 31 May 2011 *
杨琳,黄远等: "说话人识别中的总变化因子分析技术", 《网络新媒体技术》 *
龙艳花: "《博士学位论文》", 30 December 2011 *

Cited By (211)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US11676600B2 (en) 2013-03-12 2023-06-13 Cerence Operating Company Methods and apparatus for detecting a voice command
US11087750B2 (en) 2013-03-12 2021-08-10 Cerence Operating Company Methods and apparatus for detecting a voice command
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US9799335B2 (en) 2015-04-30 2017-10-24 Boe Technology Group Co., Ltd. Method and device for speech recognition
CN104821168B (zh) * 2015-04-30 2017-03-29 北京京东方多媒体科技有限公司 一种语音识别方法及装置
CN104821168A (zh) * 2015-04-30 2015-08-05 北京京东方多媒体科技有限公司 一种语音识别方法及装置
CN105137768A (zh) * 2015-07-21 2015-12-09 合肥智凯电子科技有限公司 一种可语音操作的智能家居控制系统
CN105206271A (zh) * 2015-08-25 2015-12-30 北京宇音天下科技有限公司 智能设备的语音唤醒方法及实现所述方法的系统
CN105049882B (zh) * 2015-08-28 2019-02-22 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN105049882A (zh) * 2015-08-28 2015-11-11 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN105141768A (zh) * 2015-08-31 2015-12-09 努比亚技术有限公司 多用户识别方法、装置及移动终端
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
CN105355195A (zh) * 2015-09-25 2016-02-24 小米科技有限责任公司 音频识别方法及装置
CN108604449B (zh) * 2015-09-30 2023-11-14 苹果公司 说话者识别
CN108604449A (zh) * 2015-09-30 2018-09-28 苹果公司 说话者识别
CN106683661A (zh) * 2015-11-05 2017-05-17 阿里巴巴集团控股有限公司 基于语音的角色分离方法及装置
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
CN106815507A (zh) * 2015-11-30 2017-06-09 中兴通讯股份有限公司 语音唤醒实现方法、装置及终端
WO2017092189A1 (zh) * 2015-11-30 2017-06-08 中兴通讯股份有限公司 语音唤醒实现方法、装置及终端、计算机存储介质
CN105979376A (zh) * 2015-12-02 2016-09-28 乐视致新电子科技(天津)有限公司 一种推荐方法和装置
CN106886161A (zh) * 2015-12-16 2017-06-23 美的集团股份有限公司 音箱的控制方法、系统及音箱
CN105374355A (zh) * 2015-12-17 2016-03-02 厦门科牧智能技术有限公司 一种电子坐便器的语音控制、交互系统及方法和电子坐便器
CN105609103A (zh) * 2015-12-18 2016-05-25 合肥寰景信息技术有限公司 一种语音即时识别系统
CN106920546A (zh) * 2015-12-23 2017-07-04 小米科技有限责任公司 智能识别语音的方法及装置
CN106920546B (zh) * 2015-12-23 2020-03-20 小米科技有限责任公司 智能识别语音的方法及装置
CN105719650A (zh) * 2016-01-30 2016-06-29 深圳市尔木科技有限责任公司 一种语音识别的方法及系统
US11437020B2 (en) 2016-02-10 2022-09-06 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US11736860B2 (en) 2016-02-22 2023-08-22 Sonos, Inc. Voice control of a media playback system
US11832068B2 (en) 2016-02-22 2023-11-28 Sonos, Inc. Music service selection
US11726742B2 (en) 2016-02-22 2023-08-15 Sonos, Inc. Handling of loss of pairing between networked devices
US11405430B2 (en) 2016-02-22 2022-08-02 Sonos, Inc. Networked microphone device control
US11212612B2 (en) 2016-02-22 2021-12-28 Sonos, Inc. Voice control of a media playback system
US11514898B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Voice control of a media playback system
US11513763B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Audio response playback
US11863593B2 (en) 2016-02-22 2024-01-02 Sonos, Inc. Networked microphone device control
US11556306B2 (en) 2016-02-22 2023-01-17 Sonos, Inc. Voice controlled media playback system
US11750969B2 (en) 2016-02-22 2023-09-05 Sonos, Inc. Default playback device designation
US11184704B2 (en) 2016-02-22 2021-11-23 Sonos, Inc. Music service selection
CN105915988A (zh) * 2016-04-19 2016-08-31 乐视控股(北京)有限公司 进入特定电视桌面的电视机开启方法及其电视机
CN105791935A (zh) * 2016-05-03 2016-07-20 乐视控股(北京)有限公司 一种电视的控制方法及装置
CN105959806A (zh) * 2016-05-25 2016-09-21 乐视控股(北京)有限公司 节目推荐方法及装置
US11545169B2 (en) 2016-06-09 2023-01-03 Sonos, Inc. Dynamic player selection for audio signal processing
CN106098068A (zh) * 2016-06-12 2016-11-09 腾讯科技(深圳)有限公司 一种声纹识别方法和装置
WO2017217978A1 (en) * 2016-06-15 2017-12-21 Nuance Communications, Inc. Techniques for wake-up word recognition and related systems and methods
EP3754653A1 (en) * 2016-06-15 2020-12-23 Cerence Operating Company Techniques for wake-up word recognition and related systems and methods
US11600269B2 (en) 2016-06-15 2023-03-07 Cerence Operating Company Techniques for wake-up word recognition and related systems and methods
US11664023B2 (en) 2016-07-15 2023-05-30 Sonos, Inc. Voice detection by multiple devices
US11531520B2 (en) 2016-08-05 2022-12-20 Sonos, Inc. Playback device supporting concurrent voice assistants
CN107773018A (zh) * 2016-08-29 2018-03-09 佛山市顺德区美的电热电器制造有限公司 偏好烹饪的设置和应用方法、装置及电器
US11641559B2 (en) 2016-09-27 2023-05-02 Sonos, Inc. Audio playback settings for voice interaction
US11516610B2 (en) 2016-09-30 2022-11-29 Sonos, Inc. Orientation-based playback device microphone selection
US11308961B2 (en) 2016-10-19 2022-04-19 Sonos, Inc. Arbitration-based voice recognition
US11727933B2 (en) 2016-10-19 2023-08-15 Sonos, Inc. Arbitration-based voice recognition
CN108075892B (zh) * 2016-11-09 2021-07-27 斑马智行网络(香港)有限公司 一种语音处理的方法、装置和设备
CN108075892A (zh) * 2016-11-09 2018-05-25 阿里巴巴集团控股有限公司 一种语音处理的方法、装置和设备
US11545146B2 (en) 2016-11-10 2023-01-03 Cerence Operating Company Techniques for language independent wake-up word detection
CN106782569A (zh) * 2016-12-06 2017-05-31 深圳增强现实技术有限公司 一种基于声纹注册的增强现实方法及装置
CN106847261A (zh) * 2016-12-23 2017-06-13 伟乐视讯科技股份有限公司 一种机顶盒的声纹识别系统及声纹识别方法
CN106782537A (zh) * 2016-12-27 2017-05-31 深圳前海勇艺达机器人有限公司 机器人上查询天气的方法与系统
CN107015781A (zh) * 2017-03-28 2017-08-04 联想(北京)有限公司 语音识别方法和系统
US11568876B2 (en) 2017-04-10 2023-01-31 Beijing Orion Star Technology Co., Ltd. Method and device for user registration, and electronic device
CN107147618A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户注册方法、装置及电子设备
CN107147618B (zh) * 2017-04-10 2020-05-15 易视星空科技无锡有限公司 一种用户注册方法、装置及电子设备
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
CN107147792B (zh) * 2017-05-23 2020-10-27 惠州Tcl移动通信有限公司 一种自动配置音效的方法、装置、移动终端及存储装置
CN107147792A (zh) * 2017-05-23 2017-09-08 惠州Tcl移动通信有限公司 一种自动配置音效的方法、装置、移动终端及存储装置
CN107015481A (zh) * 2017-05-31 2017-08-04 苏州远唯景电子科技有限公司 一种带语音身份认证的智能声控窗帘系统
CN109286832A (zh) * 2017-07-20 2019-01-29 中兴通讯股份有限公司 实现语音操控的方法、装置及机顶盒和计算机可读存储介质
CN107680582B (zh) * 2017-07-28 2021-03-26 平安科技(深圳)有限公司 声学模型训练方法、语音识别方法、装置、设备及介质
CN107680582A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 声学模型训练方法、语音识别方法、装置、设备及介质
US11030998B2 (en) 2017-07-28 2021-06-08 Ping An Technology (Shenzhen) Co., Ltd. Acoustic model training method, speech recognition method, apparatus, device and medium
US11380322B2 (en) 2017-08-07 2022-07-05 Sonos, Inc. Wake-word detection suppression
US11900937B2 (en) 2017-08-07 2024-02-13 Sonos, Inc. Wake-word detection suppression
US11500611B2 (en) 2017-09-08 2022-11-15 Sonos, Inc. Dynamic computation of system response volume
CN111095402A (zh) * 2017-09-11 2020-05-01 瑞典爱立信有限公司 对用户简档的声控管理
US11727939B2 (en) 2017-09-11 2023-08-15 Telefonaktiebolaget Lm Ericsson (Publ) Voice-controlled management of user profiles
WO2019051668A1 (zh) * 2017-09-13 2019-03-21 深圳传音通讯有限公司 一种智能终端的启动控制方法及启动控制系统
CN111345016A (zh) * 2017-09-13 2020-06-26 深圳传音通讯有限公司 一种智能终端的启动控制方法及启动控制系统
US10832686B2 (en) 2017-09-19 2020-11-10 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for pushing information
CN107623614A (zh) * 2017-09-19 2018-01-23 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN109584860B (zh) * 2017-09-27 2021-08-03 九阳股份有限公司 一种语音唤醒词定义方法和系统
US11646045B2 (en) 2017-09-27 2023-05-09 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US11538451B2 (en) 2017-09-28 2022-12-27 Sonos, Inc. Multi-channel acoustic echo cancellation
US11769505B2 (en) 2017-09-28 2023-09-26 Sonos, Inc. Echo of tone interferance cancellation using two acoustic echo cancellers
US11302326B2 (en) 2017-09-28 2022-04-12 Sonos, Inc. Tone interference cancellation
CN111418216A (zh) * 2017-09-29 2020-07-14 搜诺思公司 具有语音辅助的媒体回放系统
US11893308B2 (en) 2017-09-29 2024-02-06 Sonos, Inc. Media playback system with concurrent voice assistance
US11288039B2 (en) 2017-09-29 2022-03-29 Sonos, Inc. Media playback system with concurrent voice assistance
US11175888B2 (en) 2017-09-29 2021-11-16 Sonos, Inc. Media playback system with concurrent voice assistance
CN109817220A (zh) * 2017-11-17 2019-05-28 阿里巴巴集团控股有限公司 语音识别方法、装置及系统
CN108062464A (zh) * 2017-11-27 2018-05-22 北京传嘉科技有限公司 基于声纹识别的终端控制方法及系统
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
US11451908B2 (en) 2017-12-10 2022-09-20 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US11676590B2 (en) 2017-12-11 2023-06-13 Sonos, Inc. Home graph
CN108062949A (zh) * 2017-12-11 2018-05-22 广州朗国电子科技有限公司 语音控制跑步机的方法及装置
CN108156734A (zh) * 2017-12-22 2018-06-12 四川长虹电器股份有限公司 能实现个性化灯光效果的智能家庭灯具系统及控制方法
CN108305623A (zh) * 2018-01-15 2018-07-20 珠海格力电器股份有限公司 电器控制方法及装置
CN110047491A (zh) * 2018-01-16 2019-07-23 中国科学院声学研究所 一种随机数字口令相关的说话人识别方法及装置
WO2019141028A1 (zh) * 2018-01-22 2019-07-25 珠海格力电器股份有限公司 电器设备的控制方法、装置和系统
CN108320753A (zh) * 2018-01-22 2018-07-24 珠海格力电器股份有限公司 电器设备的控制方法、装置和系统
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11689858B2 (en) 2018-01-31 2023-06-27 Sonos, Inc. Device designation of playback and network microphone device arrangements
CN108958810A (zh) * 2018-02-09 2018-12-07 北京猎户星空科技有限公司 一种基于声纹的用户识别方法、装置及设备
CN108718419A (zh) * 2018-03-22 2018-10-30 江苏大丰和顺电子有限公司 一种基于声纹锁的电视智能遥控装置及其工作方法
CN110400568A (zh) * 2018-04-20 2019-11-01 比亚迪股份有限公司 智能语音系统的唤醒方法、智能语音系统及车辆
CN108665895A (zh) * 2018-05-03 2018-10-16 百度在线网络技术(北京)有限公司 用于处理信息的方法、装置和系统
CN108665895B (zh) * 2018-05-03 2021-05-25 百度在线网络技术(北京)有限公司 用于处理信息的方法、装置和系统
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11797263B2 (en) 2018-05-10 2023-10-24 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11715489B2 (en) 2018-05-18 2023-08-01 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US11792590B2 (en) 2018-05-25 2023-10-17 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
CN108922538A (zh) * 2018-05-29 2018-11-30 平安科技(深圳)有限公司 会议信息记录方法、装置、计算机设备及存储介质
US11356727B2 (en) 2018-05-29 2022-06-07 Konka Group Co., Ltd. Circuit integrated with voice wake-up function, television and voice control method
CN108877802A (zh) * 2018-05-29 2018-11-23 康佳集团股份有限公司 一种集成语音唤醒功能的电路、电视和语音控制方法
CN108847242A (zh) * 2018-05-30 2018-11-20 Oppo广东移动通信有限公司 电子设备控制方法、装置、存储介质及电子设备
WO2020001165A1 (zh) * 2018-06-27 2020-01-02 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
CN109729400A (zh) * 2018-06-27 2019-05-07 平安科技(深圳)有限公司 基于声音的设备控制方法、装置、设备及存储介质
CN108694947A (zh) * 2018-06-27 2018-10-23 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
CN108694947B (zh) * 2018-06-27 2020-06-19 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备
US11696074B2 (en) 2018-06-28 2023-07-04 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
CN109215646A (zh) * 2018-08-15 2019-01-15 北京百度网讯科技有限公司 语音交互处理方法、装置、计算机设备及存储介质
CN109215646B (zh) * 2018-08-15 2021-08-17 北京百度网讯科技有限公司 语音交互处理方法、装置、计算机设备及存储介质
US11563842B2 (en) 2018-08-28 2023-01-24 Sonos, Inc. Do not disturb feature for audio notifications
US11482978B2 (en) 2018-08-28 2022-10-25 Sonos, Inc. Audio notifications
CN109246473B (zh) * 2018-09-13 2020-06-26 苏州思必驰信息科技有限公司 基于声纹识别的个性化视频弹幕的语音交互方法及终端系统
CN109246473A (zh) * 2018-09-13 2019-01-18 苏州思必驰信息科技有限公司 基于声纹识别的个性化视频弹幕的语音交互方法及终端系统
US11432030B2 (en) 2018-09-14 2022-08-30 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11551690B2 (en) 2018-09-14 2023-01-10 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11778259B2 (en) 2018-09-14 2023-10-03 Sonos, Inc. Networked devices, systems and methods for associating playback devices based on sound codes
US11790937B2 (en) 2018-09-21 2023-10-17 Sonos, Inc. Voice detection optimization using sound metadata
US11727936B2 (en) 2018-09-25 2023-08-15 Sonos, Inc. Voice detection optimization based on selected voice assistant service
CN108986823A (zh) * 2018-09-27 2018-12-11 深圳市易控迪智能家居科技有限公司 一种语音识别解码器及语音操作系统
US11790911B2 (en) 2018-09-28 2023-10-17 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11501795B2 (en) 2018-09-29 2022-11-15 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
CN109524011A (zh) * 2018-10-22 2019-03-26 四川虹美智能科技有限公司 一种基于声纹识别的冰箱唤醒方法及装置
CN109581881A (zh) * 2018-10-22 2019-04-05 平安科技(深圳)有限公司 智能管家方法、智能管家终端及计算机可读存储介质
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11200889B2 (en) 2018-11-15 2021-12-14 Sonos, Inc. Dilated convolutions and gating for efficient keyword spotting
US11741948B2 (en) 2018-11-15 2023-08-29 Sonos Vox France Sas Dilated convolutions and gating for efficient keyword spotting
CN111198733A (zh) * 2018-11-19 2020-05-26 阿里巴巴集团控股有限公司 开机画面显示方法、终端设备及存储介质
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11557294B2 (en) 2018-12-07 2023-01-17 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11217256B2 (en) 2018-12-12 2022-01-04 Baidu Online Network Technology (Beijing) Co., Ltd. Voice interaction method, device and terminal
US11538460B2 (en) 2018-12-13 2022-12-27 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11540047B2 (en) 2018-12-20 2022-12-27 Sonos, Inc. Optimization of network microphone devices using noise classification
CN109862408B (zh) * 2018-12-29 2021-05-11 江苏爱仕达电子有限公司 一种用于智能电视语音遥控器的用户语音识别控制方法
CN111385624A (zh) * 2018-12-29 2020-07-07 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
WO2020135241A1 (zh) * 2018-12-29 2020-07-02 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
CN109862408A (zh) * 2018-12-29 2019-06-07 江苏爱仕达电子有限公司 一种用于智能电视语音遥控器的用户语音识别控制方法
CN111385624B (zh) * 2018-12-29 2021-10-01 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
CN109712623A (zh) * 2018-12-29 2019-05-03 Tcl通力电子(惠州)有限公司 语音控制方法、装置及计算机可读存储介质
CN109781410A (zh) * 2019-01-22 2019-05-21 北京君林科技股份有限公司 一种声纹识别的轴承故障检测方法及装置
CN111510778A (zh) * 2019-01-30 2020-08-07 深圳Tcl数字技术有限公司 一种智能电视快速开机方法、系统及可读存储介质
US11646023B2 (en) 2019-02-08 2023-05-09 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
WO2020221046A1 (zh) * 2019-04-30 2020-11-05 深圳Tcl新技术有限公司 一种画框电视的横竖屏切换方法及画框电视
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
CN110166821A (zh) * 2019-05-21 2019-08-23 四川虹美智能科技有限公司 一种空调的演示系统及方法
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11501773B2 (en) 2019-06-12 2022-11-15 Sonos, Inc. Network microphone device with command keyword conditioning
US11854547B2 (en) 2019-06-12 2023-12-26 Sonos, Inc. Network microphone device with command keyword eventing
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
WO2021017978A1 (zh) * 2019-07-26 2021-02-04 深圳Tcl新技术有限公司 一种智能电视语音识别方法、系统及可读存储介质
US11354092B2 (en) 2019-07-31 2022-06-07 Sonos, Inc. Noise classification for event detection
US11714600B2 (en) 2019-07-31 2023-08-01 Sonos, Inc. Noise classification for event detection
US11710487B2 (en) 2019-07-31 2023-07-25 Sonos, Inc. Locally distributed keyword detection
US11551669B2 (en) 2019-07-31 2023-01-10 Sonos, Inc. Locally distributed keyword detection
CN110517696A (zh) * 2019-08-19 2019-11-29 效生软件科技(上海)有限公司 一种可植入式离线声纹识别系统
CN110459227A (zh) * 2019-08-29 2019-11-15 四川长虹电器股份有限公司 基于智能电视的声纹注册方法
CN110570857A (zh) * 2019-09-06 2019-12-13 北京声智科技有限公司 语音唤醒方法、装置、电子设备及存储介质
CN110570857B (zh) * 2019-09-06 2020-09-15 北京声智科技有限公司 语音唤醒方法、装置、电子设备及存储介质
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11862161B2 (en) 2019-10-22 2024-01-02 Sonos, Inc. VAS toggle based on device orientation
CN113228170A (zh) * 2019-12-05 2021-08-06 海信视像科技股份有限公司 信息处理装置及非易失性存储介质
US11948571B2 (en) 2019-12-05 2024-04-02 Soundhound Ai Ip, Llc Wakeword selection
US11295741B2 (en) 2019-12-05 2022-04-05 Soundhound, Inc. Dynamic wakewords for speech-enabled devices
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11869503B2 (en) 2019-12-20 2024-01-09 Sonos, Inc. Offline voice control
CN111107400A (zh) * 2019-12-30 2020-05-05 深圳Tcl数字技术有限公司 数据收集方法、装置、智能电视及计算机可读存储介质
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
CN111261158A (zh) * 2020-01-15 2020-06-09 上海思依暄机器人科技股份有限公司 一种功能菜单定制方法、语音快捷控制方法和机器人
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification
CN111429908A (zh) * 2020-03-30 2020-07-17 北京声智科技有限公司 一种智能电子锁控制方法及装置
CN111524514A (zh) * 2020-04-22 2020-08-11 海信集团有限公司 一种语音控制方法及中控设备
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11694689B2 (en) 2020-05-20 2023-07-04 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
CN111787380A (zh) * 2020-07-06 2020-10-16 四川长虹网络科技有限责任公司 语音换台控制方法、装置和手持智能终端
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
CN111739513A (zh) * 2020-07-22 2020-10-02 江苏清微智能科技有限公司 自动化语音唤醒测试系统及其测试方法
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
CN111956923A (zh) * 2020-09-03 2020-11-20 合肥康居人智能科技有限公司 物联网智能语音控制氧浓度的制氧呼吸一体机监测系统
CN112185362A (zh) * 2020-09-24 2021-01-05 苏州思必驰信息科技有限公司 针对用户个性化服务的语音处理方法及装置
CN113823271A (zh) * 2020-12-18 2021-12-21 京东科技控股股份有限公司 语音分类模型的训练方法、装置、计算机设备及存储介质
CN113113026A (zh) * 2021-04-15 2021-07-13 重庆德方信息技术有限公司 基于家庭用户级的声纹身份认证系统和智能检测马桶
CN113421567A (zh) * 2021-08-25 2021-09-21 江西影创信息产业有限公司 基于智能眼镜的终端设备控制方法、系统及智能眼镜
CN113593584A (zh) * 2021-09-27 2021-11-02 深圳市羽翼数码科技有限公司 一种有效抑制响应时间延迟的电子产品语音控制系统
CN113948091A (zh) * 2021-12-20 2022-01-18 山东贝宁电子科技开发有限公司 民航客机陆空通话语音识别引擎及其应用方法
CN117116263B (zh) * 2023-09-15 2024-04-12 广州易云信息技术有限公司 一种基于语音识别的智能机器人唤醒方法、装置及存储介质
CN117116263A (zh) * 2023-09-15 2023-11-24 广州易云信息技术有限公司 一种基于语音识别的智能机器人唤醒方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN104575504A (zh) 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN108320733B (zh) 语音数据处理方法及装置、存储介质、电子设备
CN107767863B (zh) 语音唤醒方法、系统及智能终端
CN105632486B (zh) 一种智能硬件的语音唤醒方法和装置
CN107767861B (zh) 语音唤醒方法、系统及智能终端
US20170140750A1 (en) Method and device for speech recognition
WO2017084360A1 (zh) 一种用于语音识别方法及系统
CN102568478B (zh) 一种基于语音识别的视频播放控制方法和系统
EP1199708B1 (en) Noise robust pattern recognition
CN102982811B (zh) 一种基于实时解码的语音端点检测方法
CN105206271A (zh) 智能设备的语音唤醒方法及实现所述方法的系统
CN104036774A (zh) 藏语方言识别方法及系统
CN103065629A (zh) 一种仿人机器人的语音识别系统
CN102404278A (zh) 一种基于声纹识别的点歌系统及其应用方法
CN102945673A (zh) 一种语音指令范围动态变化的连续语音识别方法
CN110428853A (zh) 语音活性检测方法、语音活性检测装置以及电子设备
CN106558306A (zh) 用于语音识别的方法、装置和设备
CN105788596A (zh) 一种语音识别电视控制方法及系统
US11763801B2 (en) Method and system for outputting target audio, readable storage medium, and electronic device
CN115062143A (zh) 语音识别与分类方法、装置、设备、冰箱及存储介质
CN111145763A (zh) 一种基于gru的音频中的人声识别方法及系统
CN109215634A (zh) 一种多词语音控制通断装置的方法及其系统
CN110268471A (zh) 具有嵌入式降噪的asr的方法和设备
CN108322770A (zh) 视频节目识别方法、相关装置、设备和系统
CN113160854A (zh) 语音交互系统、相关方法、装置及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150429

WD01 Invention patent application deemed withdrawn after publication