CN101833951A - 用于说话人识别的多背景模型建立方法 - Google Patents
用于说话人识别的多背景模型建立方法 Download PDFInfo
- Publication number
- CN101833951A CN101833951A CN201010118149A CN201010118149A CN101833951A CN 101833951 A CN101833951 A CN 101833951A CN 201010118149 A CN201010118149 A CN 201010118149A CN 201010118149 A CN201010118149 A CN 201010118149A CN 101833951 A CN101833951 A CN 101833951A
- Authority
- CN
- China
- Prior art keywords
- ubm
- gmm
- model
- feature
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000005452 bending Methods 0.000 claims abstract description 30
- 238000001228 spectrum Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 abstract description 8
- 239000000203 mixture Substances 0.000 abstract 1
- 230000001755 vocal effect Effects 0.000 abstract 1
- 238000002474 experimental method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Abstract
Description
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101181491A CN101833951B (zh) | 2010-03-04 | 2010-03-04 | 用于说话人识别的多背景模型建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101181491A CN101833951B (zh) | 2010-03-04 | 2010-03-04 | 用于说话人识别的多背景模型建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101833951A true CN101833951A (zh) | 2010-09-15 |
CN101833951B CN101833951B (zh) | 2011-11-09 |
Family
ID=42718004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101181491A Expired - Fee Related CN101833951B (zh) | 2010-03-04 | 2010-03-04 | 用于说话人识别的多背景模型建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101833951B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102238190A (zh) * | 2011-08-01 | 2011-11-09 | 安徽科大讯飞信息科技股份有限公司 | 身份认证方法及系统 |
CN102270451A (zh) * | 2011-08-18 | 2011-12-07 | 安徽科大讯飞信息科技股份有限公司 | 说话人识别方法及系统 |
CN102664011A (zh) * | 2012-05-17 | 2012-09-12 | 吉林大学 | 一种快速说话人识别方法 |
CN102779510A (zh) * | 2012-07-19 | 2012-11-14 | 东南大学 | 基于特征空间自适应投影的语音情感识别方法 |
CN102968986A (zh) * | 2012-11-07 | 2013-03-13 | 华南理工大学 | 基于长时特征和短时特征的重叠语音与单人语音区分方法 |
WO2013086736A1 (zh) * | 2011-12-16 | 2013-06-20 | 华为技术有限公司 | 说话人识别方法及设备 |
CN103221996A (zh) * | 2010-12-10 | 2013-07-24 | 松下电器产业株式会社 | 用于验证说话人的口令建模的设备和方法、以及说话人验证系统 |
CN104167208A (zh) * | 2014-08-08 | 2014-11-26 | 中国科学院深圳先进技术研究院 | 一种说话人识别方法和装置 |
CN104240706A (zh) * | 2014-09-12 | 2014-12-24 | 浙江大学 | 一种基于GMM Token配比相似度校正得分的说话人识别方法 |
CN104361891A (zh) * | 2014-11-17 | 2015-02-18 | 科大讯飞股份有限公司 | 特定人群的个性化彩铃自动审核方法及系统 |
CN104517066A (zh) * | 2014-12-16 | 2015-04-15 | 上海师范大学 | 一种文件夹加密方法 |
CN105656887A (zh) * | 2015-12-30 | 2016-06-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的声纹认证方法以及装置 |
CN103985381B (zh) * | 2014-05-16 | 2016-09-21 | 清华大学 | 一种基于参数融合优化决策的音频索引方法 |
CN106062871A (zh) * | 2014-03-28 | 2016-10-26 | 英特尔公司 | 使用所选择的群组样本子集来训练分类器 |
CN106601238A (zh) * | 2015-10-14 | 2017-04-26 | 阿里巴巴集团控股有限公司 | 一种应用操作的处理方法和装置 |
CN107358945A (zh) * | 2017-07-26 | 2017-11-17 | 谢兵 | 一种基于机器学习的多人对话音频识别方法及系统 |
CN107358947A (zh) * | 2017-06-23 | 2017-11-17 | 武汉大学 | 说话人重识别方法及系统 |
CN108766465A (zh) * | 2018-06-06 | 2018-11-06 | 华中师范大学 | 一种基于enf通用背景模型的数字音频篡改盲检测方法 |
CN109378014A (zh) * | 2018-10-22 | 2019-02-22 | 华中师范大学 | 一种基于卷积神经网络的移动设备源识别方法及系统 |
CN109545227A (zh) * | 2018-04-28 | 2019-03-29 | 华中师范大学 | 基于深度自编码网络的说话人性别自动识别方法及系统 |
CN110364182A (zh) * | 2019-08-01 | 2019-10-22 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种声音信号处理方法及装置 |
CN110631064A (zh) * | 2018-05-31 | 2019-12-31 | 宁波方太厨具有限公司 | 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 |
US10902850B2 (en) | 2017-08-31 | 2021-01-26 | Interdigital Ce Patent Holdings | Apparatus and method for residential speaker recognition |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040128131A1 (en) * | 2002-12-26 | 2004-07-01 | Motorola, Inc. | Identification apparatus and method |
US20040260552A1 (en) * | 2003-06-23 | 2004-12-23 | International Business Machines Corporation | Method and apparatus to compensate for fundamental frequency changes and artifacts and reduce sensitivity to pitch information in a frame-based speech processing system |
US20070106511A1 (en) * | 2005-11-04 | 2007-05-10 | Advanced Telecommunications Research Institute International | Speaker identifying apparatus and computer program product |
CN101053015A (zh) * | 2004-10-30 | 2007-10-10 | 国际商业机器公司 | 话音分组识别 |
US20080082331A1 (en) * | 2006-09-29 | 2008-04-03 | Kabushiki Kaisha Toshiba | Method and apparatus for enrollment and evaluation of speaker authentification |
CN101226743A (zh) * | 2007-12-05 | 2008-07-23 | 浙江大学 | 基于中性和情感声纹模型转换的说话人识别方法 |
EP1989701A1 (en) * | 2006-02-20 | 2008-11-12 | Microsoft Corporation | Speaker authentication |
CN101419799A (zh) * | 2008-11-25 | 2009-04-29 | 浙江大学 | 基于混合t模型的说话人识别方法 |
CN101447188A (zh) * | 2007-11-27 | 2009-06-03 | 北京金运昭德数字科技有限公司 | 数字声纹鉴定系统及确认和辨认方法 |
US7567903B1 (en) * | 2005-01-12 | 2009-07-28 | At&T Intellectual Property Ii, L.P. | Low latency real-time vocal tract length normalization |
-
2010
- 2010-03-04 CN CN2010101181491A patent/CN101833951B/zh not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040128131A1 (en) * | 2002-12-26 | 2004-07-01 | Motorola, Inc. | Identification apparatus and method |
US20040260552A1 (en) * | 2003-06-23 | 2004-12-23 | International Business Machines Corporation | Method and apparatus to compensate for fundamental frequency changes and artifacts and reduce sensitivity to pitch information in a frame-based speech processing system |
CN101053015A (zh) * | 2004-10-30 | 2007-10-10 | 国际商业机器公司 | 话音分组识别 |
US7567903B1 (en) * | 2005-01-12 | 2009-07-28 | At&T Intellectual Property Ii, L.P. | Low latency real-time vocal tract length normalization |
US20070106511A1 (en) * | 2005-11-04 | 2007-05-10 | Advanced Telecommunications Research Institute International | Speaker identifying apparatus and computer program product |
EP1989701A1 (en) * | 2006-02-20 | 2008-11-12 | Microsoft Corporation | Speaker authentication |
US20080082331A1 (en) * | 2006-09-29 | 2008-04-03 | Kabushiki Kaisha Toshiba | Method and apparatus for enrollment and evaluation of speaker authentification |
CN101447188A (zh) * | 2007-11-27 | 2009-06-03 | 北京金运昭德数字科技有限公司 | 数字声纹鉴定系统及确认和辨认方法 |
CN101226743A (zh) * | 2007-12-05 | 2008-07-23 | 浙江大学 | 基于中性和情感声纹模型转换的说话人识别方法 |
CN101419799A (zh) * | 2008-11-25 | 2009-04-29 | 浙江大学 | 基于混合t模型的说话人识别方法 |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9257121B2 (en) | 2010-12-10 | 2016-02-09 | Panasonic Intellectual Property Corporation Of America | Device and method for pass-phrase modeling for speaker verification, and verification system |
CN103221996B (zh) * | 2010-12-10 | 2015-09-30 | 松下电器(美国)知识产权公司 | 用于验证说话人的口令建模的设备和方法、以及说话人验证系统 |
CN103221996A (zh) * | 2010-12-10 | 2013-07-24 | 松下电器产业株式会社 | 用于验证说话人的口令建模的设备和方法、以及说话人验证系统 |
CN102238190B (zh) * | 2011-08-01 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 身份认证方法及系统 |
CN102238190A (zh) * | 2011-08-01 | 2011-11-09 | 安徽科大讯飞信息科技股份有限公司 | 身份认证方法及系统 |
CN102270451A (zh) * | 2011-08-18 | 2011-12-07 | 安徽科大讯飞信息科技股份有限公司 | 说话人识别方法及系统 |
CN103562993B (zh) * | 2011-12-16 | 2015-05-27 | 华为技术有限公司 | 说话人识别方法及设备 |
US9142210B2 (en) | 2011-12-16 | 2015-09-22 | Huawei Technologies Co., Ltd. | Method and device for speaker recognition |
WO2013086736A1 (zh) * | 2011-12-16 | 2013-06-20 | 华为技术有限公司 | 说话人识别方法及设备 |
CN103562993A (zh) * | 2011-12-16 | 2014-02-05 | 华为技术有限公司 | 说话人识别方法及设备 |
CN102664011B (zh) * | 2012-05-17 | 2014-03-12 | 吉林大学 | 一种快速说话人识别方法 |
CN102664011A (zh) * | 2012-05-17 | 2012-09-12 | 吉林大学 | 一种快速说话人识别方法 |
CN102779510A (zh) * | 2012-07-19 | 2012-11-14 | 东南大学 | 基于特征空间自适应投影的语音情感识别方法 |
CN102968986B (zh) * | 2012-11-07 | 2015-01-28 | 华南理工大学 | 基于长时特征和短时特征的重叠语音与单人语音区分方法 |
CN102968986A (zh) * | 2012-11-07 | 2013-03-13 | 华南理工大学 | 基于长时特征和短时特征的重叠语音与单人语音区分方法 |
CN106062871A (zh) * | 2014-03-28 | 2016-10-26 | 英特尔公司 | 使用所选择的群组样本子集来训练分类器 |
CN103985381B (zh) * | 2014-05-16 | 2016-09-21 | 清华大学 | 一种基于参数融合优化决策的音频索引方法 |
CN104167208B (zh) * | 2014-08-08 | 2017-09-15 | 中国科学院深圳先进技术研究院 | 一种说话人识别方法和装置 |
CN104167208A (zh) * | 2014-08-08 | 2014-11-26 | 中国科学院深圳先进技术研究院 | 一种说话人识别方法和装置 |
CN104240706B (zh) * | 2014-09-12 | 2017-08-15 | 浙江大学 | 一种基于GMM Token配比相似度校正得分的说话人识别方法 |
CN104240706A (zh) * | 2014-09-12 | 2014-12-24 | 浙江大学 | 一种基于GMM Token配比相似度校正得分的说话人识别方法 |
CN104361891A (zh) * | 2014-11-17 | 2015-02-18 | 科大讯飞股份有限公司 | 特定人群的个性化彩铃自动审核方法及系统 |
CN104517066A (zh) * | 2014-12-16 | 2015-04-15 | 上海师范大学 | 一种文件夹加密方法 |
CN106601238A (zh) * | 2015-10-14 | 2017-04-26 | 阿里巴巴集团控股有限公司 | 一种应用操作的处理方法和装置 |
US10699716B2 (en) | 2015-12-30 | 2020-06-30 | Baidu Online Network Technology (Beijing) Co., Ltd. | Artificial intelligence-based method and device for voiceprint authentication |
CN105656887A (zh) * | 2015-12-30 | 2016-06-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的声纹认证方法以及装置 |
CN107358947A (zh) * | 2017-06-23 | 2017-11-17 | 武汉大学 | 说话人重识别方法及系统 |
CN107358945A (zh) * | 2017-07-26 | 2017-11-17 | 谢兵 | 一种基于机器学习的多人对话音频识别方法及系统 |
US10902850B2 (en) | 2017-08-31 | 2021-01-26 | Interdigital Ce Patent Holdings | Apparatus and method for residential speaker recognition |
US11763810B2 (en) | 2017-08-31 | 2023-09-19 | Interdigital Madison Patent Holdings, Sas | Apparatus and method for residential speaker recognition |
CN109545227A (zh) * | 2018-04-28 | 2019-03-29 | 华中师范大学 | 基于深度自编码网络的说话人性别自动识别方法及系统 |
CN110631064A (zh) * | 2018-05-31 | 2019-12-31 | 宁波方太厨具有限公司 | 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 |
CN110631064B (zh) * | 2018-05-31 | 2021-01-15 | 宁波方太厨具有限公司 | 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 |
CN108766465A (zh) * | 2018-06-06 | 2018-11-06 | 华中师范大学 | 一种基于enf通用背景模型的数字音频篡改盲检测方法 |
CN108766465B (zh) * | 2018-06-06 | 2020-07-28 | 华中师范大学 | 一种基于enf通用背景模型的数字音频篡改盲检测方法 |
CN109378014A (zh) * | 2018-10-22 | 2019-02-22 | 华中师范大学 | 一种基于卷积神经网络的移动设备源识别方法及系统 |
CN110364182A (zh) * | 2019-08-01 | 2019-10-22 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种声音信号处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101833951B (zh) | 2011-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101833951B (zh) | 用于说话人识别的多背景模型建立方法 | |
CN107610707B (zh) | 一种声纹识别方法及装置 | |
CN102737633B (zh) | 一种基于张量子空间分析的说话人识别方法及其装置 | |
CN102820033B (zh) | 一种声纹识别方法 | |
CN102270451B (zh) | 说话人识别方法及系统 | |
CN103440873B (zh) | 一种基于相似性的音乐推荐方法 | |
CN104392718B (zh) | 一种基于声学模型阵列的鲁棒语音识别方法 | |
CN105261367B (zh) | 一种说话人识别方法 | |
CN106952643A (zh) | 一种基于高斯均值超矢量与谱聚类的录音设备聚类方法 | |
CN103456302B (zh) | 一种基于情感gmm模型权重合成的情感说话人识别方法 | |
CN102486922B (zh) | 说话人识别方法、装置和系统 | |
CN104240706B (zh) | 一种基于GMM Token配比相似度校正得分的说话人识别方法 | |
CN102968986A (zh) | 基于长时特征和短时特征的重叠语音与单人语音区分方法 | |
CN101640043A (zh) | 基于多坐标序列内核的说话人识别方法和系统 | |
CN109767776B (zh) | 一种基于密集神经网络的欺骗语音检测方法 | |
CN104123933A (zh) | 基于自适应非平行训练的语音转换方法 | |
CN102789779A (zh) | 一种语音识别系统及其识别方法 | |
CN102968990A (zh) | 说话人识别方法和系统 | |
CN104485108A (zh) | 一种基于多说话人模型的噪声与说话人联合补偿方法 | |
CN103280224A (zh) | 基于自适应算法的非对称语料库条件下的语音转换方法 | |
CN110047504B (zh) | 身份矢量x-vector线性变换下的说话人识别方法 | |
CN103323532A (zh) | 一种基于心理声学参量的鱼类识别方法及系统 | |
CN103219008B (zh) | 基于基状态矢量加权的短语音说话人识别方法 | |
CN104392719B (zh) | 一种用于语音识别系统的中心子带模型自适应方法 | |
CN103578480A (zh) | 负面情绪检测中的基于上下文修正的语音情感识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20161216 Address after: 100084 Zhongguancun Haidian District East Road No. 1, building 8, floor 8, A803B, Patentee after: Beijing Hua Chong Chong Information Technology Co., Ltd. Address before: 100084 Beijing 100084-82 mailbox Patentee before: Qinghua UNiversity |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200330 Address after: 100084 Tsinghua University, Beijing, Haidian District Patentee after: TSINGHUA University Address before: 100084 Zhongguancun Haidian District East Road No. 1, building 8, floor 8, A803B, Patentee before: BEIJING HUA KONG CHUANG WEI INFORMATION TECHNOLOGY Co.,Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111109 Termination date: 20210304 |