CN109378006A - 一种跨设备声纹识别方法及系统 - Google Patents

一种跨设备声纹识别方法及系统 Download PDF

Info

Publication number
CN109378006A
CN109378006A CN201811620418.7A CN201811620418A CN109378006A CN 109378006 A CN109378006 A CN 109378006A CN 201811620418 A CN201811620418 A CN 201811620418A CN 109378006 A CN109378006 A CN 109378006A
Authority
CN
China
Prior art keywords
vocal print
user
equipment
voice
mapping model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811620418.7A
Other languages
English (en)
Other versions
CN109378006B (zh
Inventor
武永超
陈洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics China R&D Center
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics China R&D Center
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics China R&D Center, Samsung Electronics Co Ltd filed Critical Samsung Electronics China R&D Center
Priority to CN201811620418.7A priority Critical patent/CN109378006B/zh
Publication of CN109378006A publication Critical patent/CN109378006A/zh
Priority to US17/417,720 priority patent/US20220076674A1/en
Priority to PCT/KR2019/018735 priority patent/WO2020139058A1/en
Application granted granted Critical
Publication of CN109378006B publication Critical patent/CN109378006B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请公开了一种跨设备声纹识别方法和系统,包括:建立不同设备之间的声纹映射模型;从第一设备收录的语音中提取声纹,进行声纹注册;从第二设备收录的语音指令中提取声纹特征,基于所建立的声纹映射模型将所述声纹特征映射到通过其他设备注册的声纹,识别出对应的用户ID;根据所述语音指令操作所述用户ID对应的用户数据,完成语音控制。应用本申请公开的技术方案,能够提高跨设备声纹识别的准确率。

Description

一种跨设备声纹识别方法及系统
技术领域
本申请涉及声纹识别技术领域,特别涉及一种跨设备声纹识别方法及系统。
背景技术
声纹(voiceprint):是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人的声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,两者的声纹却始终不相同。
声纹识别:就是把声信号转换成电信号,再用计算机进行识别。
声纹注册:用户注册一段语音,后台从这段语音中提取声纹作为用户ID。当用户说话时,提取其中的声纹,对应到相应的ID,从而实现用户区分。
现有技术的主要问题在于:由于麦克风设备硬件存在差异,使得不同设备的声音采集质量参差不齐,进而导致声纹识别的准确率较低。例如:用户使用手机1注册的声纹,用手机2去做语音控制时,可能识别不出是同一个人。
发明内容
本申请提供了一种跨设备声纹识别方法及系统,以提高跨设备声纹识别的准确率。
本申请提供了一种跨设备声纹识别方法,应用于控制设备,包括:
建立不同设备之间的声纹映射模型;
从第一设备收录的语音中提取声纹,进行声纹注册;
从第二设备收录的语音指令中提取声纹特征,基于所建立的声纹映射模型将所述声纹特征映射到通过其他设备注册的声纹,识别出对应的用户ID;
根据所述语音指令操作所述用户ID对应的用户数据,完成语音控制。
较佳的,所述建立不同设备之间的声纹映射模型包括:从各设备收录的语音中提取声纹,通过提取声纹特征进行建模,或者通过深度学习的方法进行建模,构建得到不同设备所收录语音的声纹之间映射关系的声纹映射模型。
较佳的,所述进行声纹注册包括:将所述声纹与现有的用户ID进行绑定,或者将所述声纹作为用户ID。
较佳的,所述第一设备收录的语音为:用户朗读的一段预设的提示文字。
较佳的,在进行声纹注册之后,还包括:将播放历史数据导入对应的用户ID
在识别出对应的用户ID之后,还包括:读取所述用户ID的播放历史数据,根据所述播放历史数据进行内容推荐。
本申请还公开了一种跨设备声纹识别系统,包括:控制设备和至少一个具有麦克风的设备;
所述至少一个具有麦克风的设备,用于收录语音,并发送给所述控制设备;其中,第一设备和第二设备是所述具有麦克风的设备;
所述控制设备,用于建立不同设备之间的声纹映射模型;并用于从第一设备收录的语音中提取声纹,进行声纹注册;还用于从第二设备收录的语音指令中提取声纹特征,基于所建立的声纹映射模型将所述声纹特征映射到通过其他设备注册的声纹,识别出对应的用户ID;还用于根据所述语音指令操作所述用户ID对应的用户数据,完成语音控制。
较佳的,所述控制设备包括:声纹映射管理模块、声纹映射模型模块、声纹特征提取模块、用户系统模块和模型生成管理模块,其中:
所述声纹映射管理模块,用于根据预先建立的不同设备之间的声纹映射模型,将当前输入的声纹映射成其他设备的声纹;
所述声纹映射模型是预先生成的设备间的声纹映射模型;
所述声纹特征提取模块,用于根据输入的语音数据,提取声纹特征;
所述用户系统模块,用于进行声纹注册和用户ID管理;
所述模型生成管理模块,用于构建不同设备之间的声纹映射模型。
较佳的,所述声纹特征提取模块所提取的声纹特征是基于输入语音提取的所有声纹数据或者部分声纹数据。
较佳的,所述声纹特征提取模块从各设备收录的语音中提取声纹,所述模型生成管理模块通过提取的声纹特征进行建模,或者通过深度学习的方法进行建模,构建得到不同设备所收录语音的声纹之间映射关系的声纹映射模型。
较佳的,所述用户系统模块具体包括:声纹注册子模块、声纹匹配子模块、用户ID子模块和用户数据子模块;其中:
所述声纹注册子模块,用于将新注册用户的声纹与用户系统中现有的用户ID相关联;
所述声纹匹配子模块,用于对接收到的声纹与已注册的声纹进行匹配,以确定对应的用户ID;
所述用户ID子模块,用于维护用户ID,其中,用户ID是用户的唯一标志;
所述用户数据子模块,用于维护用户数据,其中,用户数据是与用户相关的私有数据。
由上述技术方案可见,采用本发明提供的技术方案,能够屏蔽不同语音设备之间的差异,提高跨设备声纹识别的准确率,从而通过不同设备实现对同一设备的语音操作,给用户提供更好的体验。
附图说明
图1为本发明跨设备声纹识别方法的流程示意图;
图2为本发明跨设备声纹识别系统的组成结构示意图;
图3为本发明实施例一跨麦克风设备进行音乐播放控制的流程示意图。
具体实施方式
为使本申请的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本申请作进一步详细说明。
本发明提出一种跨设备声纹识别方法及系统,通过预先建立不同设备之间的声纹映射模型,使得用户使用任何一种设备发出语音指令时,都能映射到该用户已注册的声纹,进而提高用户声纹的识别率。
本发明提出的跨设备声纹识别方法流程图如图1所示,包含如下关键步骤:
步骤101:建立不同设备(如电视语音遥控器、手机、录音笔等)之间的声纹映射模型。
建立声纹映射模型的具体过程为:
首先,采集同一个人在不同设备上的语音数据,提取声纹,建立一条数据记录;
然后,以上述方法采集多人的语音数据,并提取声纹,建立大的数据集;
最后,根据建立的大数据集,以深度学习的方式,训练映射模型,将同一个人在设备A上的声纹,映射到设备B上。反过来,用户使用不同的设备发出语音,根据该模型,也能判断是否为同一个人。
假设f(device,voiceprint)是本发明声纹映射模型的映射函数,输入声纹voiceprint和设备名称device,就能得到基于device设备的声纹数据。
步骤102:第一设备收录用户的语音(例如:用户可以朗读一段预设的提示文字),控制设备从该语音中提取声纹,并对该用户进行声纹注册。
这里,控制设备是指:在一个小型家庭网络中,用于进行后台控制和处理的设备。
其中,声纹注册可以是将该声纹与现有的用户ID进行绑定,或者直接将该声纹作为用户ID。
步骤103:第二设备收录用户发出的语音指令。
步骤104:控制设备从该语音指令中提取声纹特征,基于所建立的声纹映射模型,将该声纹特征映射到通过其他设备注册的声纹,识别出对应的用户ID,从而找到对应的用户数据。
步骤105:根据该语音指令操作该用户ID对应的用户数据,完成语音控制。
对应于上述方法,本发明还提出了一种跨设备声纹识别系统,其组成结构如图2所示,该系统中除麦克风设备之外的其他模块都是控制设备中的模块,具体而言:
1)声纹映射管理模块
用于根据预先建立的不同设备之间的声纹映射模型,将当前输入的声纹映射成其他设备的声纹。
2)声纹映射模型模块
声纹映射模型是预先生成的设备间的声纹映射模型,声纹映射模型可以通过提取声纹特征建模生成,也可以通过深度学习训练生成,或者采用其他方式生成。
3)声纹特征提取模块
用于根据输入的语音数据,提取声纹特征。声纹特征可以是基于输入语音提取的所有声纹数据,也可以是基于输入语音提取的部分声纹数据。
4)用户系统模块,具体包括:声纹注册子模块、声纹匹配子模块、用户ID子模块和用户数据子模块;其中:
A)声纹注册子模块:用于将新注册用户的声纹与用户系统中现有的用户ID相关联。
B)声纹匹配子模块:用于对接收到的声纹与已注册的声纹进行匹配,从而确定对应的用户ID。
C)用户ID子模块:用于维护用户ID,其中,用户ID是用户的唯一标志。
D)用户数据子模块:用于维护用户数据,其中,用户数据是与用户相关的私有数据,如访问历史、收藏夹等。
5)模型生成管理模块
用于构建不同设备之间的声纹映射模型。
下面通过两个较佳实施例对本申请上述技术方案进行进一步详细说明。
实施例一:
本实施例以跨麦克风设备进行音乐播放控制为例说明本发明实现流程,本实施例的流程示意图如图3所示。
该流程的预处理部分包括:控制设备从各语音设备收录的语音中提取声纹,通过提取声纹特征进行建模,或者通过深度学习等方法进行建模,构建得到不同设备所收录语音的声纹之间映射关系的声纹映射模型。其中,可以由如图2所示的模型生成管理模块负责该预处理工作。
图3所示跨麦克风设备进行音乐播放控制的实施流程如下:
1)用户对着手机麦克风朗读一段提示文字,声纹注册模块将用户的声纹提取出来,并关联用户ID,或者直接将该声纹作为用户ID。
2)该用户在使用电视机时,用电视遥控器说“播放我的音乐”。此时,麦克风硬件已经更换,由于设备硬件参数不同,声纹数据有所不同。
3)声纹特征提取模块根据当前的电视遥控器录入的声音,提取对应的声纹。但是用户系统内的注册声纹为手机麦克风采集的声纹,所以需要进一步进行声纹匹配。
4)用户系统的声纹匹配模块,通过声纹映射管理模块读取声纹映射模型,产生相同声音在其他设备上的声纹,并与系统内已经注册的声纹进行匹配。
5)在用户系统内,寻找对应的用户ID。如果该用户ID不存在,则匹配失败,给出相应的提示;如果匹配成功,则进行下一步处理。
采用本发明进行上述处理后,如果寻找到对应的用户ID,接下来可以按照现有技术进行后续的语音指令解析和设备控制,具体包括:
6)自然语音处理模块解析用户的语音指令,将其翻译为设备可以执行的命令,其他执行单元根据该命令执行对应的操作。
7)执行单元访问该用户的收藏音乐数据并播放。
实施例二:
本实施例以推荐用户喜欢的影视剧节目为例说明本发明实现流程,如下:
预处理部分与实施例一相同,在此不再赘述。
本实施例的实施流程如下:
1)用户1通过语音播放武侠类电视剧,例如说“播放金庸的神雕侠侣”。
2)声纹提取模块提取用户1的声纹,并与播放历史数据相关联。如果用户系统中不存在该声纹,则创建新的用户ID;如果用户系统中存在该声纹,则将播放历史数据导入用户系统中对应的用户ID。
3)用户2通过语音播放宫廷剧,例如说“我要看甄嬛传”。
4)声纹提取模块提取用户2的声纹,与该用户的播放历史数据相关联,并对用户2执行与上述步骤2)相同的操作。
5)假设本实施例中的电视安装了基于用户播放历史的影视剧推荐系统,该推荐系统可以根据用户看过什么来猜测用户喜好,并给出推荐的影视剧。
6)用户1在初始状态下,说“播放我喜欢的影视剧”。
7)声纹特征提取模块根据当前的声音,生成对应的声纹。
8)用户系统的声纹匹配模块,通过声纹映射管理模块读取声纹映射模型,产生相同声音在其他设备上的声纹,并与系统内已经注册的声纹进行匹配,找到用户1对应的用户ID。
9)推荐系统读取用户1的历史播放数据“神雕侠侣”,给出推荐影视剧“射雕英雄传”、“侠客行”等。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种跨设备声纹识别方法,应用于控制设备,其特征在于,包括:
建立不同设备之间的声纹映射模型;
从第一设备收录的语音中提取声纹,进行声纹注册;
从第二设备收录的语音指令中提取声纹特征,基于所建立的声纹映射模型将所述声纹特征映射到通过其他设备注册的声纹,识别出对应的用户ID;
根据所述语音指令操作所述用户ID对应的用户数据,完成语音控制。
2.根据权利要求1所述的方法,其特征在于:
所述建立不同设备之间的声纹映射模型包括:从各设备收录的语音中提取声纹,通过提取声纹特征进行建模,或者通过深度学习的方法进行建模,构建得到不同设备所收录语音的声纹之间映射关系的声纹映射模型。
3.根据权利要求1或2所述的方法,其特征在于:
所述进行声纹注册包括:将所述声纹与现有的用户ID进行绑定,或者将所述声纹作为用户ID。
4.根据权利要求1或2所述的方法,其特征在于:
所述第一设备收录的语音为:用户朗读的一段预设的提示文字。
5.根据权利要求3所述的方法,其特征在于:
在进行声纹注册之后,还包括:将播放历史数据导入对应的用户ID
在识别出对应的用户ID之后,还包括:读取所述用户ID的播放历史数据,根据所述播放历史数据进行内容推荐。
6.一种跨设备声纹识别系统,其特征在于,包括:控制设备和至少一个具有麦克风的设备;
所述至少一个具有麦克风的设备,用于收录语音,并发送给所述控制设备;其中,第一设备和第二设备是所述具有麦克风的设备;
所述控制设备,用于建立不同设备之间的声纹映射模型;并用于从第一设备收录的语音中提取声纹,进行声纹注册;还用于从第二设备收录的语音指令中提取声纹特征,基于所建立的声纹映射模型将所述声纹特征映射到通过其他设备注册的声纹,识别出对应的用户ID;还用于根据所述语音指令操作所述用户ID对应的用户数据,完成语音控制。
7.根据权利要求6所述的系统,其特征在于,所述控制设备包括:声纹映射管理模块、声纹映射模型模块、声纹特征提取模块、用户系统模块和模型生成管理模块,其中:
所述声纹映射管理模块,用于根据预先建立的不同设备之间的声纹映射模型,将当前输入的声纹映射成其他设备的声纹;
所述声纹映射模型是预先生成的设备间的声纹映射模型;
所述声纹特征提取模块,用于根据输入的语音数据,提取声纹特征;
所述用户系统模块,用于进行声纹注册和用户ID管理;
所述模型生成管理模块,用于构建不同设备之间的声纹映射模型。
8.根据权利要求7所述的系统,其特征在于:
所述声纹特征提取模块所提取的声纹特征是基于输入语音提取的所有声纹数据或者部分声纹数据。
9.根据权利要求7所述的系统,其特征在于:
所述声纹特征提取模块从各设备收录的语音中提取声纹,所述模型生成管理模块通过提取的声纹特征进行建模,或者通过深度学习的方法进行建模,构建得到不同设备所收录语音的声纹之间映射关系的声纹映射模型。
10.根据权利要求7所述的系统,其特征在于:
所述用户系统模块具体包括:声纹注册子模块、声纹匹配子模块、用户ID子模块和用户数据子模块;其中:
所述声纹注册子模块,用于将新注册用户的声纹与用户系统中现有的用户ID相关联;
所述声纹匹配子模块,用于对接收到的声纹与已注册的声纹进行匹配,以确定对应的用户ID;
所述用户ID子模块,用于维护用户ID,其中,用户ID是用户的唯一标志;
所述用户数据子模块,用于维护用户数据,其中,用户数据是与用户相关的私有数据。
CN201811620418.7A 2018-12-28 2018-12-28 一种跨设备声纹识别方法及系统 Active CN109378006B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201811620418.7A CN109378006B (zh) 2018-12-28 2018-12-28 一种跨设备声纹识别方法及系统
US17/417,720 US20220076674A1 (en) 2018-12-28 2019-12-30 Cross-device voiceprint recognition
PCT/KR2019/018735 WO2020139058A1 (en) 2018-12-28 2019-12-30 Cross-device voiceprint recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811620418.7A CN109378006B (zh) 2018-12-28 2018-12-28 一种跨设备声纹识别方法及系统

Publications (2)

Publication Number Publication Date
CN109378006A true CN109378006A (zh) 2019-02-22
CN109378006B CN109378006B (zh) 2022-09-16

Family

ID=65372157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811620418.7A Active CN109378006B (zh) 2018-12-28 2018-12-28 一种跨设备声纹识别方法及系统

Country Status (3)

Country Link
US (1) US20220076674A1 (zh)
CN (1) CN109378006B (zh)
WO (1) WO2020139058A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310657A (zh) * 2019-07-10 2019-10-08 北京猎户星空科技有限公司 一种音频数据处理方法及装置
CN111916074A (zh) * 2020-06-29 2020-11-10 厦门快商通科技股份有限公司 一种跨设备语音控制方法、系统、终端及存储介质
CN112926042A (zh) * 2021-04-13 2021-06-08 效生软件科技(上海)有限公司 一种跨通道生物语音识别验证系统及验证方法
WO2022007757A1 (zh) * 2020-07-07 2022-01-13 华为技术有限公司 跨设备声纹注册方法、电子设备及存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111540350B (zh) * 2020-03-31 2024-03-01 北京小米移动软件有限公司 一种智能语音控制设备的控制方法、装置及存储介质
US20220148600A1 (en) * 2020-11-11 2022-05-12 Rovi Guides, Inc. Systems and methods for detecting a mimicked voice input signal
US20230036045A1 (en) * 2021-07-30 2023-02-02 International Business Machines Corporation Adapting artificial intelligence (ai) ecosystem specifications
CN116052692A (zh) * 2021-10-28 2023-05-02 华为终端有限公司 声纹注册方法及电子设备
CN115713936A (zh) * 2022-10-21 2023-02-24 广州视声智能股份有限公司 基于智能家居的语音控制方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047508A (zh) * 2007-01-15 2007-10-03 深圳市莱克科技有限公司 登录认证系统
CN104639517A (zh) * 2013-11-15 2015-05-20 阿里巴巴集团控股有限公司 利用人体生物特征进行身份验证的方法和装置
CN105321520A (zh) * 2014-06-16 2016-02-10 丰唐物联技术(深圳)有限公司 一种语音控制方法及装置
CN108259280A (zh) * 2018-02-06 2018-07-06 北京语智科技有限公司 一种室内智能化控制的实现方法、系统
CN108288470A (zh) * 2017-01-10 2018-07-17 富士通株式会社 基于声纹的身份验证方法和装置
CN108492830A (zh) * 2018-03-28 2018-09-04 深圳市声扬科技有限公司 声纹识别方法、装置、计算机设备和存储介质
CN108615537A (zh) * 2018-05-02 2018-10-02 广州国音科技有限公司 一种多信道录音方法、装置及系统
US20180286395A1 (en) * 2017-03-28 2018-10-04 Lenovo (Beijing) Co., Ltd. Speech recognition devices and speech recognition methods

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8509736B2 (en) * 2002-08-08 2013-08-13 Global Tel*Link Corp. Telecommunication call management and monitoring system with voiceprint verification
US8682667B2 (en) * 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) * 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US11270699B2 (en) * 2011-04-22 2022-03-08 Emerging Automotive, Llc Methods and vehicles for capturing emotion of a human driver and customizing vehicle response
US9493130B2 (en) * 2011-04-22 2016-11-15 Angel A. Penilla Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input
US10529328B2 (en) * 2015-06-22 2020-01-07 Carnegie Mellon University Processing speech signals in voice-based profiling
KR102356969B1 (ko) * 2015-09-24 2022-01-28 삼성전자주식회사 통신 수행 방법 및 이를 지원하는 전자장치
KR102453603B1 (ko) * 2015-11-10 2022-10-12 삼성전자주식회사 전자 장치 및 그 제어 방법
CN105513597B (zh) * 2015-12-30 2018-07-10 百度在线网络技术(北京)有限公司 声纹认证处理方法及装置
US9965247B2 (en) * 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
DE102016116077A1 (de) * 2016-08-29 2018-03-01 Unify Patente Gmbh & Co. Kg Verfahren zum Zuweisen einer MAC-Adresse zu einem Kommunikationsgerät in einer Netzwerkumgebung und Datenbank mit MAC-Adressen
US11314898B2 (en) * 2017-02-28 2022-04-26 Samsung Electronics Co., Ltd. Operating method of electronic device for function execution based on voice command in locked state and electronic device supporting the same
KR102266879B1 (ko) * 2017-04-14 2021-06-22 삼성전자주식회사 대화형 콘텐츠 제공 시스템
WO2018213415A1 (en) * 2017-05-16 2018-11-22 Apple Inc. Far-field extension for digital assistant services
CN109146450A (zh) * 2017-06-16 2019-01-04 阿里巴巴集团控股有限公司 支付方法、客户端、电子设备、存储介质和服务器
KR20190099586A (ko) * 2018-02-19 2019-08-28 삼성전자주식회사 전자 장치, 전자 장치의 제어방법 및 서버
KR20200111853A (ko) * 2019-03-19 2020-10-05 삼성전자주식회사 전자 장치 및 전자 장치의 음성 인식 제어 방법

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047508A (zh) * 2007-01-15 2007-10-03 深圳市莱克科技有限公司 登录认证系统
CN104639517A (zh) * 2013-11-15 2015-05-20 阿里巴巴集团控股有限公司 利用人体生物特征进行身份验证的方法和装置
CN105321520A (zh) * 2014-06-16 2016-02-10 丰唐物联技术(深圳)有限公司 一种语音控制方法及装置
CN108288470A (zh) * 2017-01-10 2018-07-17 富士通株式会社 基于声纹的身份验证方法和装置
US20180286395A1 (en) * 2017-03-28 2018-10-04 Lenovo (Beijing) Co., Ltd. Speech recognition devices and speech recognition methods
CN108259280A (zh) * 2018-02-06 2018-07-06 北京语智科技有限公司 一种室内智能化控制的实现方法、系统
CN108492830A (zh) * 2018-03-28 2018-09-04 深圳市声扬科技有限公司 声纹识别方法、装置、计算机设备和存储介质
CN108615537A (zh) * 2018-05-02 2018-10-02 广州国音科技有限公司 一种多信道录音方法、装置及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310657A (zh) * 2019-07-10 2019-10-08 北京猎户星空科技有限公司 一种音频数据处理方法及装置
CN110310657B (zh) * 2019-07-10 2022-02-08 北京猎户星空科技有限公司 一种音频数据处理方法及装置
CN111916074A (zh) * 2020-06-29 2020-11-10 厦门快商通科技股份有限公司 一种跨设备语音控制方法、系统、终端及存储介质
WO2022007757A1 (zh) * 2020-07-07 2022-01-13 华为技术有限公司 跨设备声纹注册方法、电子设备及存储介质
CN112926042A (zh) * 2021-04-13 2021-06-08 效生软件科技(上海)有限公司 一种跨通道生物语音识别验证系统及验证方法
CN112926042B (zh) * 2021-04-13 2024-01-16 效生软件科技(上海)有限公司 一种跨通道生物语音识别验证系统及验证方法

Also Published As

Publication number Publication date
WO2020139058A1 (en) 2020-07-02
CN109378006B (zh) 2022-09-16
US20220076674A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
CN109378006A (zh) 一种跨设备声纹识别方法及系统
US9430467B2 (en) Mobile speech-to-speech interpretation system
CN108399923B (zh) 多人发言中发言人识别方法以及装置
CN104185868B (zh) 话音认证和语音识别系统及方法
US11763808B2 (en) Temporary account association with voice-enabled devices
CN110049270A (zh) 多人会议语音转写方法、装置、系统、设备及存储介质
WO2021159688A1 (zh) 声纹识别方法、装置、存储介质、电子装置
US10714085B2 (en) Temporary account association with voice-enabled devices
JP6084654B2 (ja) 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法
US10706848B1 (en) Anomaly detection for voice controlled devices
JP2018527609A (ja) ユーザ声紋モデルを構築するための方法、装置、及びシステム
CN108074576A (zh) 审讯场景下的说话人角色分离方法及系统
EP1395803A1 (en) Background learning of speaker voices
CN106796785A (zh) 用于产生声音检测模型的声音样本验证
CN110956965A (zh) 一种基于声纹识别的个性化智能家居安全控制系统及方法
CN107277276A (zh) 一种具备语音控制功能智能手机
CN109791764A (zh) 基于话音的通信
US10861453B1 (en) Resource scheduling with voice controlled devices
US10424292B1 (en) System for recognizing and responding to environmental noises
CN110516083A (zh) 相册管理方法、存储介质及电子设备
Maskeliunas et al. Voice-based human-machine interaction modeling for automated information services
CN105718781A (zh) 基于声纹识别的操作终端设备的方法及终端设备
CN112417412A (zh) 一种银行账户余额查询方法、装置及系统
US10854196B1 (en) Functional prerequisites and acknowledgments
CN112513845A (zh) 与语音使能设备的暂时账户关联

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant