CN108922543B - 模型库建立方法、语音识别方法、装置、设备及介质 - Google Patents

模型库建立方法、语音识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN108922543B
CN108922543B CN201810592869.8A CN201810592869A CN108922543B CN 108922543 B CN108922543 B CN 108922543B CN 201810592869 A CN201810592869 A CN 201810592869A CN 108922543 B CN108922543 B CN 108922543B
Authority
CN
China
Prior art keywords
model
hierarchical
voice
voice data
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810592869.8A
Other languages
English (en)
Chinese (zh)
Other versions
CN108922543A (zh
Inventor
涂宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810592869.8A priority Critical patent/CN108922543B/zh
Priority to PCT/CN2018/104040 priority patent/WO2019237518A1/fr
Publication of CN108922543A publication Critical patent/CN108922543A/zh
Application granted granted Critical
Publication of CN108922543B publication Critical patent/CN108922543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)
CN201810592869.8A 2018-06-11 2018-06-11 模型库建立方法、语音识别方法、装置、设备及介质 Active CN108922543B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810592869.8A CN108922543B (zh) 2018-06-11 2018-06-11 模型库建立方法、语音识别方法、装置、设备及介质
PCT/CN2018/104040 WO2019237518A1 (fr) 2018-06-11 2018-09-05 Procédé d'établissement de bibliothèque de modèles, procédé et appareil de reconnaissance vocale, ainsi que dispositif et support

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810592869.8A CN108922543B (zh) 2018-06-11 2018-06-11 模型库建立方法、语音识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN108922543A CN108922543A (zh) 2018-11-30
CN108922543B true CN108922543B (zh) 2022-08-16

Family

ID=64418041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810592869.8A Active CN108922543B (zh) 2018-06-11 2018-06-11 模型库建立方法、语音识别方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN108922543B (fr)
WO (1) WO2019237518A1 (fr)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060667B (zh) * 2019-03-15 2023-05-30 平安科技(深圳)有限公司 语音信息的批量处理方法、装置、计算机设备及存储介质
CN110148403B (zh) * 2019-05-21 2021-04-13 腾讯科技(深圳)有限公司 解码网络生成方法、语音识别方法、装置、设备及介质
CN110414709A (zh) * 2019-06-18 2019-11-05 重庆金融资产交易所有限责任公司 债务风险智能预测方法、装置及计算机可读存储介质
CN110782879B (zh) * 2019-09-18 2023-07-07 平安科技(深圳)有限公司 基于样本量的声纹聚类方法、装置、设备及存储介质
WO2021128256A1 (fr) * 2019-12-27 2021-07-01 深圳市优必选科技股份有限公司 Procédé, appareil et dispositif de conversion de voix, et support de stockage
CN112634863B (zh) * 2020-12-09 2024-02-09 深圳市优必选科技股份有限公司 一种语音合成模型的训练方法、装置、电子设备及介质
CN114530163B (zh) * 2021-12-31 2024-07-09 安徽云磬科技产业发展有限公司 基于密度聚类的采用声音识别设备生命周期的方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1211026A (zh) * 1997-09-05 1999-03-17 中国科学院声学研究所 汉语普通话大词汇连续语音识别技术
CN1447278A (zh) * 2002-11-15 2003-10-08 郑方 一种声纹识别方法
CN1535460A (zh) * 2001-03-01 2004-10-06 �Ҵ���˾ 分级语言模型
CN102789779A (zh) * 2012-07-12 2012-11-21 广东外语外贸大学 一种语音识别系统及其识别方法
CN104268279A (zh) * 2014-10-16 2015-01-07 魔方天空科技(北京)有限公司 语料数据的查询方法和装置
CN105006231A (zh) * 2015-05-08 2015-10-28 南京邮电大学 基于模糊聚类决策树的分布式大型人口语者识别方法
CN105096955A (zh) * 2015-09-06 2015-11-25 广东外语外贸大学 一种基于模型生长聚类的说话人快速识别方法及系统
CN107993663A (zh) * 2017-09-11 2018-05-04 北京航空航天大学 一种基于Android的声纹识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6684186B2 (en) * 1999-01-26 2004-01-27 International Business Machines Corporation Speaker recognition using a hierarchical speaker model tree
US6941264B2 (en) * 2001-08-16 2005-09-06 Sony Electronics Inc. Retraining and updating speech models for speech recognition
CN101562012B (zh) * 2008-04-16 2011-07-20 创而新(中国)科技有限公司 语音分级测定方法及系统
CN105096935B (zh) * 2014-05-06 2019-08-09 阿里巴巴集团控股有限公司 一种语音输入方法、装置和系统
CN104135577A (zh) * 2014-08-27 2014-11-05 陈包容 一种基于自定义语音实现快速查找联系人的方法和装置
CN107993071A (zh) * 2017-11-21 2018-05-04 平安科技(深圳)有限公司 电子装置、基于声纹的身份验证方法及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1211026A (zh) * 1997-09-05 1999-03-17 中国科学院声学研究所 汉语普通话大词汇连续语音识别技术
CN1535460A (zh) * 2001-03-01 2004-10-06 �Ҵ���˾ 分级语言模型
CN1447278A (zh) * 2002-11-15 2003-10-08 郑方 一种声纹识别方法
CN102789779A (zh) * 2012-07-12 2012-11-21 广东外语外贸大学 一种语音识别系统及其识别方法
CN104268279A (zh) * 2014-10-16 2015-01-07 魔方天空科技(北京)有限公司 语料数据的查询方法和装置
CN105006231A (zh) * 2015-05-08 2015-10-28 南京邮电大学 基于模糊聚类决策树的分布式大型人口语者识别方法
CN105096955A (zh) * 2015-09-06 2015-11-25 广东外语外贸大学 一种基于模型生长聚类的说话人快速识别方法及系统
CN107993663A (zh) * 2017-09-11 2018-05-04 北京航空航天大学 一种基于Android的声纹识别方法

Also Published As

Publication number Publication date
WO2019237518A1 (fr) 2019-12-19
CN108922543A (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
CN108922543B (zh) 模型库建立方法、语音识别方法、装置、设备及介质
CN109065028B (zh) 说话人聚类方法、装置、计算机设备及存储介质
CN108922544B (zh) 通用向量训练方法、语音聚类方法、装置、设备及介质
CN110600017B (zh) 语音处理模型的训练方法、语音识别方法、系统及装置
US20210050020A1 (en) Voiceprint recognition method, model training method, and server
CN108597496B (zh) 一种基于生成式对抗网络的语音生成方法及装置
CN109065022B (zh) i-vector向量提取方法、说话人识别方法、装置、设备及介质
WO2019232829A1 (fr) Procédé et appareil de reconnaissance d'empreinte vocale, dispositif informatique et support d'enregistrement
WO2019227586A1 (fr) Procédé d'apprentissage de modèle de voix, procédé, appareil, dispositif et support de reconnaissance de locuteur
JP2021516369A (ja) 混合音声の認識方法、装置及びコンピュータ可読記憶媒体
CN109308912B (zh) 音乐风格识别方法、装置、计算机设备及存储介质
TW201935464A (zh) 基於記憶性瓶頸特徵的聲紋識別的方法及裝置
CN109360572B (zh) 通话分离方法、装置、计算机设备及存储介质
WO2019227574A1 (fr) Procédé d'apprentissage de modèle vocal, procédé, dispositif et équipement de reconnaissance vocale, et support
CN111785288B (zh) 语音增强方法、装置、设备及存储介质
CN108922559A (zh) 基于语音时频变换特征和整数线性规划的录音终端聚类方法
CN113223536B (zh) 声纹识别方法、装置及终端设备
CN113488060B (zh) 一种基于变分信息瓶颈的声纹识别方法及系统
WO2019232833A1 (fr) Procédé et dispositif de différentiation vocale, dispositif d'ordinateur et support d'informations
CN112053694A (zh) 一种基于cnn与gru网络融合的声纹识别方法
WO2024055752A9 (fr) Procédé d'apprentissage de modèle de synthèse vocale, procédé de synthèse vocale et appareils associés
CN118230722B (zh) 基于ai的智能语音识别方法及系统
CN114913860A (zh) 声纹识别方法、装置、计算机设备、存储介质及程序产品
Zhipeng et al. Voiceprint recognition based on BP Neural Network and CNN
CN113593525A (zh) 口音分类模型训练和口音分类方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant