CN105139857A - 一种自动说话人识别中针对语音欺骗的对抗方法 - Google Patents
一种自动说话人识别中针对语音欺骗的对抗方法 Download PDFInfo
- Publication number
- CN105139857A CN105139857A CN201510561139.8A CN201510561139A CN105139857A CN 105139857 A CN105139857 A CN 105139857A CN 201510561139 A CN201510561139 A CN 201510561139A CN 105139857 A CN105139857 A CN 105139857A
- Authority
- CN
- China
- Prior art keywords
- vector
- feature
- mfcc
- voice
- ppp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012360 testing method Methods 0.000 claims abstract description 18
- 238000011161 development Methods 0.000 claims abstract description 9
- 238000012706 support-vector machine Methods 0.000 claims abstract description 6
- 238000000605 extraction Methods 0.000 claims abstract description 3
- 238000001228 spectrum Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000000513 principal component analysis Methods 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000009432 framing Methods 0.000 claims description 2
- 230000008676 import Effects 0.000 claims description 2
- 238000002386 leaching Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 230000007935 neutral effect Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000011156 evaluation Methods 0.000 abstract 2
- 238000013459 approach Methods 0.000 abstract 1
- 230000001020 rhythmical effect Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 6
- 230000008485 antagonism Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Abstract
Description
方法 | EER(%) |
MFCC i-vector | 6.63 |
MFCC-PPP i-vector | 1.06 |
MGDCC-PPP i-vector | 2.23 |
OpenSMILE | 1.57 |
训练集 | 测试集 | PLDA | LIBLINEAR |
人声和欺骗手段 | 人声和欺骗手段[1] | 3.57 | 3.4 |
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510561139.8A CN105139857B (zh) | 2015-09-02 | 2015-09-02 | 一种自动说话人识别中针对语音欺骗的对抗方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510561139.8A CN105139857B (zh) | 2015-09-02 | 2015-09-02 | 一种自动说话人识别中针对语音欺骗的对抗方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105139857A true CN105139857A (zh) | 2015-12-09 |
CN105139857B CN105139857B (zh) | 2019-03-22 |
Family
ID=54725179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510561139.8A Active CN105139857B (zh) | 2015-09-02 | 2015-09-02 | 一种自动说话人识别中针对语音欺骗的对抗方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105139857B (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869630A (zh) * | 2016-06-27 | 2016-08-17 | 上海交通大学 | 基于深度学习的说话人语音欺骗攻击检测方法及系统 |
CN106019230A (zh) * | 2016-05-27 | 2016-10-12 | 南京邮电大学 | 一种基于i-vector说话人识别的声源定位方法 |
WO2017162017A1 (zh) * | 2016-03-25 | 2017-09-28 | 腾讯科技(深圳)有限公司 | 语音数据处理方法、装置和存储介质 |
WO2017166651A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 语音识别模型训练方法、说话人类型识别方法及装置 |
CN107274905A (zh) * | 2016-04-08 | 2017-10-20 | 腾讯科技(深圳)有限公司 | 一种声纹识别方法及系统 |
CN107274906A (zh) * | 2017-06-28 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 语音信息处理方法、装置、终端及存储介质 |
CN107527616A (zh) * | 2017-09-29 | 2017-12-29 | 上海与德通讯技术有限公司 | 智能识别方法及机器人 |
CN108564955A (zh) * | 2018-03-19 | 2018-09-21 | 平安科技(深圳)有限公司 | 电子装置、身份验证方法和计算机可读存储介质 |
CN109448759A (zh) * | 2018-12-28 | 2019-03-08 | 武汉大学 | 一种基于气爆音的抗语音认证欺骗攻击检测方法 |
CN109887496A (zh) * | 2019-01-22 | 2019-06-14 | 浙江大学 | 一种黑盒场景下的定向对抗音频生成方法及系统 |
CN109920447A (zh) * | 2019-01-29 | 2019-06-21 | 天津大学 | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 |
CN109935233A (zh) * | 2019-01-29 | 2019-06-25 | 天津大学 | 一种基于振幅和相位信息的录音攻击检测方法 |
CN110047504A (zh) * | 2019-04-18 | 2019-07-23 | 东华大学 | 身份矢量x-vector线性变换下的说话人识别方法 |
CN110176243A (zh) * | 2018-08-10 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 语音增强方法、模型训练方法、装置和计算机设备 |
CN110232927A (zh) * | 2019-06-13 | 2019-09-13 | 苏州思必驰信息科技有限公司 | 说话人验证反欺骗方法和装置 |
WO2019210796A1 (zh) * | 2018-05-02 | 2019-11-07 | Oppo广东移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN110491391A (zh) * | 2019-07-02 | 2019-11-22 | 厦门大学 | 一种基于深度神经网络的欺骗语音检测方法 |
WO2020019831A1 (zh) * | 2018-07-23 | 2020-01-30 | 深圳大学 | 特定人群识别方法、电子装置及计算机可读存储介质 |
CN111276131A (zh) * | 2020-01-22 | 2020-06-12 | 厦门大学 | 一种基于深度神经网络的多类声学特征整合方法和系统 |
CN111755014A (zh) * | 2020-07-02 | 2020-10-09 | 四川长虹电器股份有限公司 | 一种领域自适应的录音重放攻击检测方法及系统 |
WO2020253054A1 (zh) * | 2019-06-20 | 2020-12-24 | 平安科技(深圳)有限公司 | 评估音频信号损失的方法、装置及存储介质 |
CN113409771A (zh) * | 2021-05-25 | 2021-09-17 | 合肥讯飞数码科技有限公司 | 一种伪造音频的检测方法及其检测系统和存储介质 |
CN113611314A (zh) * | 2021-08-03 | 2021-11-05 | 成都理工大学 | 一种说话人识别方法及系统 |
CN113808603A (zh) * | 2021-09-29 | 2021-12-17 | 恒安嘉新(北京)科技股份公司 | 一种音频篡改检测方法、装置、服务器和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6246751B1 (en) * | 1997-08-11 | 2001-06-12 | International Business Machines Corporation | Apparatus and methods for user identification to deny access or service to unauthorized users |
CN101127777A (zh) * | 2007-10-10 | 2008-02-20 | 华为技术有限公司 | 处理语音通信安全威胁信息的方法、装置及系统 |
US20100054433A1 (en) * | 2008-09-03 | 2010-03-04 | Alcatel-Lucent | Verifying authenticity of voice mail participants in telephony networks |
US20140359739A1 (en) * | 2013-05-31 | 2014-12-04 | International Business Machines Corporation | Voice based biometric authentication method and apparatus |
WO2014203370A1 (ja) * | 2013-06-20 | 2014-12-24 | 株式会社東芝 | 音声合成辞書作成装置及び音声合成辞書作成方法 |
CN104717219A (zh) * | 2015-03-20 | 2015-06-17 | 百度在线网络技术(北京)有限公司 | 基于人工智能的声纹登录方法和装置 |
-
2015
- 2015-09-02 CN CN201510561139.8A patent/CN105139857B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6246751B1 (en) * | 1997-08-11 | 2001-06-12 | International Business Machines Corporation | Apparatus and methods for user identification to deny access or service to unauthorized users |
CN101127777A (zh) * | 2007-10-10 | 2008-02-20 | 华为技术有限公司 | 处理语音通信安全威胁信息的方法、装置及系统 |
US20100054433A1 (en) * | 2008-09-03 | 2010-03-04 | Alcatel-Lucent | Verifying authenticity of voice mail participants in telephony networks |
US20140359739A1 (en) * | 2013-05-31 | 2014-12-04 | International Business Machines Corporation | Voice based biometric authentication method and apparatus |
CN104217149A (zh) * | 2013-05-31 | 2014-12-17 | 国际商业机器公司 | 基于语音的生物认证方法及设备 |
WO2014203370A1 (ja) * | 2013-06-20 | 2014-12-24 | 株式会社東芝 | 音声合成辞書作成装置及び音声合成辞書作成方法 |
CN104717219A (zh) * | 2015-03-20 | 2015-06-17 | 百度在线网络技术(北京)有限公司 | 基于人工智能的声纹登录方法和装置 |
Non-Patent Citations (10)
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017162017A1 (zh) * | 2016-03-25 | 2017-09-28 | 腾讯科技(深圳)有限公司 | 语音数据处理方法、装置和存储介质 |
US10692503B2 (en) | 2016-03-25 | 2020-06-23 | Tencent Technology (Shenzhen) Company Limited | Voice data processing method, apparatus and storage medium |
WO2017166651A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 语音识别模型训练方法、说话人类型识别方法及装置 |
CN107274905A (zh) * | 2016-04-08 | 2017-10-20 | 腾讯科技(深圳)有限公司 | 一种声纹识别方法及系统 |
CN106019230A (zh) * | 2016-05-27 | 2016-10-12 | 南京邮电大学 | 一种基于i-vector说话人识别的声源定位方法 |
CN105869630A (zh) * | 2016-06-27 | 2016-08-17 | 上海交通大学 | 基于深度学习的说话人语音欺骗攻击检测方法及系统 |
CN105869630B (zh) * | 2016-06-27 | 2019-08-02 | 上海交通大学 | 基于深度学习的说话人语音欺骗攻击检测方法及系统 |
CN107274906A (zh) * | 2017-06-28 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 语音信息处理方法、装置、终端及存储介质 |
CN107527616A (zh) * | 2017-09-29 | 2017-12-29 | 上海与德通讯技术有限公司 | 智能识别方法及机器人 |
CN108564955A (zh) * | 2018-03-19 | 2018-09-21 | 平安科技(深圳)有限公司 | 电子装置、身份验证方法和计算机可读存储介质 |
WO2019179029A1 (zh) * | 2018-03-19 | 2019-09-26 | 平安科技(深圳)有限公司 | 电子装置、身份验证方法和计算机可读存储介质 |
WO2019210796A1 (zh) * | 2018-05-02 | 2019-11-07 | Oppo广东移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
WO2020019831A1 (zh) * | 2018-07-23 | 2020-01-30 | 深圳大学 | 特定人群识别方法、电子装置及计算机可读存储介质 |
CN110176243B (zh) * | 2018-08-10 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 语音增强方法、模型训练方法、装置和计算机设备 |
CN110176243A (zh) * | 2018-08-10 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 语音增强方法、模型训练方法、装置和计算机设备 |
CN109448759A (zh) * | 2018-12-28 | 2019-03-08 | 武汉大学 | 一种基于气爆音的抗语音认证欺骗攻击检测方法 |
CN109887496A (zh) * | 2019-01-22 | 2019-06-14 | 浙江大学 | 一种黑盒场景下的定向对抗音频生成方法及系统 |
CN109935233A (zh) * | 2019-01-29 | 2019-06-25 | 天津大学 | 一种基于振幅和相位信息的录音攻击检测方法 |
CN109920447A (zh) * | 2019-01-29 | 2019-06-21 | 天津大学 | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 |
CN109920447B (zh) * | 2019-01-29 | 2021-07-13 | 天津大学 | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 |
CN110047504B (zh) * | 2019-04-18 | 2021-08-20 | 东华大学 | 身份矢量x-vector线性变换下的说话人识别方法 |
CN110047504A (zh) * | 2019-04-18 | 2019-07-23 | 东华大学 | 身份矢量x-vector线性变换下的说话人识别方法 |
CN110232927A (zh) * | 2019-06-13 | 2019-09-13 | 苏州思必驰信息科技有限公司 | 说话人验证反欺骗方法和装置 |
CN110232927B (zh) * | 2019-06-13 | 2021-08-13 | 思必驰科技股份有限公司 | 说话人验证反欺骗方法和装置 |
WO2020253054A1 (zh) * | 2019-06-20 | 2020-12-24 | 平安科技(深圳)有限公司 | 评估音频信号损失的方法、装置及存储介质 |
CN110491391A (zh) * | 2019-07-02 | 2019-11-22 | 厦门大学 | 一种基于深度神经网络的欺骗语音检测方法 |
CN111276131A (zh) * | 2020-01-22 | 2020-06-12 | 厦门大学 | 一种基于深度神经网络的多类声学特征整合方法和系统 |
CN111755014B (zh) * | 2020-07-02 | 2022-06-03 | 四川长虹电器股份有限公司 | 一种领域自适应的录音重放攻击检测方法及系统 |
CN111755014A (zh) * | 2020-07-02 | 2020-10-09 | 四川长虹电器股份有限公司 | 一种领域自适应的录音重放攻击检测方法及系统 |
CN113409771A (zh) * | 2021-05-25 | 2021-09-17 | 合肥讯飞数码科技有限公司 | 一种伪造音频的检测方法及其检测系统和存储介质 |
CN113611314A (zh) * | 2021-08-03 | 2021-11-05 | 成都理工大学 | 一种说话人识别方法及系统 |
CN113808603A (zh) * | 2021-09-29 | 2021-12-17 | 恒安嘉新(北京)科技股份公司 | 一种音频篡改检测方法、装置、服务器和存储介质 |
CN113808603B (zh) * | 2021-09-29 | 2023-07-07 | 恒安嘉新(北京)科技股份公司 | 一种音频篡改检测方法、装置、服务器和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105139857B (zh) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105139857A (zh) | 一种自动说话人识别中针对语音欺骗的对抗方法 | |
CN107610707B (zh) | 一种声纹识别方法及装置 | |
CN103177733B (zh) | 汉语普通话儿化音发音质量评测方法与系统 | |
Alegre et al. | Spoofing countermeasures to protect automatic speaker verification from voice conversion | |
CN105261367B (zh) | 一种说话人识别方法 | |
CN105810212B (zh) | 一种复杂噪声环境下的列车鸣笛识别方法 | |
CN108694954A (zh) | 一种性别年龄识别方法、装置、设备及可读存储介质 | |
CN111724770B (zh) | 一种基于深度卷积生成对抗网络的音频关键词识别方法 | |
CN105023573A (zh) | 使用听觉注意力线索的语音音节/元音/音素边界检测 | |
CN105654944B (zh) | 一种融合了短时与长时特征建模的环境声识别方法及装置 | |
Das et al. | Bangladeshi dialect recognition using Mel frequency cepstral coefficient, delta, delta-delta and Gaussian mixture model | |
CN108091326A (zh) | 一种基于线性回归的声纹识别方法及系统 | |
CN105280181B (zh) | 一种语种识别模型的训练方法及语种识别方法 | |
CN109346084A (zh) | 基于深度堆栈自编码网络的说话人识别方法 | |
CN103077720A (zh) | 一种说话人识别方法及系统 | |
CN104221079A (zh) | 利用频谱特性进行声音分析的改进的梅尔滤波器组结构 | |
CN104575519A (zh) | 特征提取方法、装置及重音检测的方法、装置 | |
Pruthi et al. | Acoustic parameters for the automatic detection of vowel nasalization. | |
CN105845141A (zh) | 基于信道鲁棒的说话人确认模型及说话人确认方法和装置 | |
Bhati et al. | Unsupervised Speech Signal to Symbol Transformation for Zero Resource Speech Applications. | |
CN109920447A (zh) | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 | |
Gupta et al. | Segment-level pyramid match kernels for the classification of varying length patterns of speech using SVMs | |
Michalevsky et al. | Speaker identification using diffusion maps | |
CN112349267A (zh) | 基于注意力机制特征的合成语音检测方法 | |
CN109410968B (zh) | 一种高效的歌曲中人声起始位置检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 510275 Xingang West Road, Guangdong, Guangzhou, No. 135, No. Applicant after: Sun Yat-sen University Applicant after: Internation combination research institute of Carnegie Mellon University of Shunde Zhongshan University Address before: 528300 Daliang street, Shunde District, Guangdong,,, Carnegie Mellon University, Zhongshan University, Shunde Applicant before: Internation combination research institute of Carnegie Mellon University of Shunde Zhongshan University Applicant before: Sun Yat-sen University |
|
COR | Change of bibliographic data | ||
GR01 | Patent grant | ||
GR01 | Patent grant |