CN113490115A - 一种基于声纹识别技术的声反馈抑制方法及系统 - Google Patents

一种基于声纹识别技术的声反馈抑制方法及系统 Download PDF

Info

Publication number
CN113490115A
CN113490115A CN202110931690.2A CN202110931690A CN113490115A CN 113490115 A CN113490115 A CN 113490115A CN 202110931690 A CN202110931690 A CN 202110931690A CN 113490115 A CN113490115 A CN 113490115A
Authority
CN
China
Prior art keywords
audio signal
voiceprint
voiceprint recognition
recognition technology
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110931690.2A
Other languages
English (en)
Inventor
徐海
汪泽培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Desam Audio Co ltd
Original Assignee
Guangzhou Desam Audio Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Desam Audio Co ltd filed Critical Guangzhou Desam Audio Co ltd
Priority to CN202110931690.2A priority Critical patent/CN113490115A/zh
Publication of CN113490115A publication Critical patent/CN113490115A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于声纹识别技术的声反馈抑制方法及系统,方法包括拾音设备采集音频信号,依据声纹识别技术对所述音频信号进行分析,得到人发出的音频信号和音响发出的音频信号,采用反馈抑制器对所述音响发出的音频信号进行衰减,从而实现声反馈抑制;通过采用声纹识别技术区分出人发出的音频信号和音响发出的音频信号,并采用反馈抑制器对所述音响发出的音频信号进行衰减,能够保证不失真的同时,还能够实现高增益的效果,从而解决了现有技术存在的声音失真和增益小的缺陷。

Description

一种基于声纹识别技术的声反馈抑制方法及系统
技术领域
本发明涉及声反馈抑制技术领域,尤其涉及一种基于声纹识别技术的声反馈抑制方法及系统。
背景技术
自从扩声系统被广泛应用以来,语音信号处理就一直受声反馈问题的困扰,扩声系统的共同特征就是对声音信号进行放大,以得到较大的输出音量,在扩声系统中,声音由扬声器发出,当扬声器输出信号耦合进入麦克风时,就形成了一个闭环的反馈系统,当系统增益过大时,由于声反馈现象,就会产生刺耳的啸叫声。
现有技术主要通过两种方式解决声反馈导致的啸叫现象,第一种方式为采用移频的方式,第二种方式为采用陷波的方式,然而,采用移频的方式虽然对啸叫现象有所改善,但输出信号的频率和输入信号的频率已不相同,所以会造成声音的失真,采用陷波的方式声音的失真很小,但是增益提升小,对于增益要求很高的扩声系统,比如使用了高增益的电容话筒扩声系统,音量调节很难达到使用要求。
发明内容
有鉴于此,本发明提出一种基于声纹识别技术的声反馈抑制方法及系统,可以解决现有声反馈抑制方法所存在的声音失真和增益小的缺陷。
本发明的技术方案是这样实现的:
一种基于声纹识别技术的声反馈抑制方法,具体包括以下步骤:
步骤S1,拾音设备采集音频信号;
步骤S2,依据声纹识别技术对所述音频信号进行分析,得到人发出的音频信号和音响发出的音频信号;
步骤S3,采用反馈抑制器对所述音响发出的音频信号进行衰减,从而实现声反馈抑制。
作为所述基于声纹识别技术的声反馈抑制方法的进一步可选该方案,所述步骤S2具体包括以下步骤:
步骤S21,对所述音频信号进行特征提取,得到声纹特征;
步骤S22,将所述声纹特征输入至预设的声纹识别模型中进行识别,得到人发出的音频信号和音响发出的音频信号。
作为所述基于声纹识别技术的声反馈抑制方法的进一步可选方案,所述步骤S21具体包括以下步骤:
步骤S211,对所述音频信号进行快速傅里叶转换,得到转换后的音频信号;
步骤S212,对所述转换后的音频信号进行滤波处理,得到所述音频信号对应的声纹能量,并将所述音频信号对应的声纹能量确定为所述音频信号对应的声纹特征。
作为所述基于声纹识别技术的声反馈抑制方法的进一步可选方案,所述声纹识别模型生成的方式具体包括以下步骤:
获取人发出的音频信号样本数据和音响发出的音频信号样本数据;
创建神经网络模型,将所述人发出的音频信号样本数据和音响发出的音频信号样本数据输入至所述神经网络模型中训练,得到声纹识别模型。
作为所述基于声纹识别技术的声反馈抑制方法的进一步可选方案,所述神经网络模型采用RNN模型、DNN模型或CNN模型。
一种基于声纹识别技术的声反馈抑制系统,所述系统包括:
拾音设备,用于采集音频信号;
分析模块,用于依据声纹识别技术对所述音频信号进行分析,得到人发出的音频信号和音响发出的音频信号;
反馈抑制器,用于对所述音响发出的音频信号进行衰减,从而实现声反馈抑制。
作为所述基于声纹识别技术的声反馈抑制系统的进一步可选方案,所述分析模块包括:
特征提取模块,用于对所述音频信号进行特征提取,得到声纹特征;
识别模块,用于将所述声纹特征输入至预设的声纹识别模型中进行识别,得到人发出的音频信号和音响发出的音频信号。
作为所述基于声纹识别技术的声反馈抑制系统的进一步可选方案,所述特征提取模块包括:
转换模块,用于对所述音频信号进行快速傅里叶转换,得到转换后的音频信号;
滤波模块,用于对所述转换后的音频信号进行滤波处理,得到所述音频信号对应的声纹能量,并将所述音频信号对应的声纹能量确定为所述音频信号对应的声纹特征。
本发明的有益效果是:通过采用声纹识别技术区分出人发出的音频信号和音响发出的音频信号,并采用反馈抑制器对所述音响发出的音频信号进行衰减,能够保证不失真的同时,还能够实现高增益的效果,从而解决了现有技术存在的声音失真和增益小的缺陷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于声纹识别技术的声反馈抑制方法的流程示意图;
图2为本发明一种基于声纹识别技术的声反馈抑制系统的组成示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
参考图1-2,一种基于声纹识别技术的声反馈抑制方法,具体包括以下步骤:
步骤S1,拾音设备采集音频信号;
步骤S2,依据声纹识别技术对所述音频信号进行分析,得到人发出的音频信号和音响发出的音频信号;
步骤S3,采用反馈抑制器对所述音响发出的音频信号进行衰减,从而实现声反馈抑制。
在本实施例中,通过采用声纹识别技术区分出人发出的音频信号和音响发出的音频信号,并采用反馈抑制器对所述音响发出的音频信号进行衰减,能够保证不失真的同时,还能够实现高增益的效果,从而解决了现有技术存在的声音失真和增益小的缺陷。
需要说明的是,所述拾音设备包括但不限于麦克风和话筒,这里不做具体限定,此外,反馈抑制器对所述音响发出的音频信号进行衰减,而人发出的音频信号正常进行功放播放。
优选的,所述步骤S2具体包括以下步骤:
步骤S21,对所述音频信号进行特征提取,得到声纹特征;
步骤S22,将所述声纹特征输入至预设的声纹识别模型中进行识别,得到人发出的音频信号和音响发出的音频信号。
在本实施例中,由于不同类型的音频信号具有不同的声纹特征,通过提取音频信号的声纹特征,能够准确识别出音频信号的类型,此外,通过采用声纹识别模型对声纹特征进行识别,能够提高识别的效率和准确率。
优选的,所述步骤S21具体包括以下步骤:
步骤S211,对所述音频信号进行快速傅里叶转换,得到转换后的音频信号;
步骤S212,对所述转换后的音频信号进行滤波处理,得到所述音频信号对应的声纹能量,并将所述音频信号对应的声纹能量确定为所述音频信号对应的声纹特征。
在本实施例中,由于不同类型的音频信号具有不同的声纹能量,通过将声纹能量确定为声纹特征,能够进一步提高声纹识别的准确度,从而也进一步提高声反馈抑制的准确度。
优选的,所述声纹识别模型生成的方式具体包括以下步骤:
获取人发出的音频信号样本数据和音响发出的音频信号样本数据;
创建神经网络模型,将所述人发出的音频信号样本数据和音响发出的音频信号样本数据输入至所述神经网络模型中训练,得到声纹识别模型。
在本实施例中,通过采用神经网络模型训练得到声纹识别模型,能够进一步提高声纹识别的准确度,同时还能够提高声纹识别的效率,进而提高声反馈抑制的准确度和效率。
优选的,所述神经网络模型采用RNN模型、DNN模型或CNN模型。
一种基于声纹识别技术的声反馈抑制系统,所述系统包括:
拾音设备,用于采集音频信号;
分析模块,用于依据声纹识别技术对所述音频信号进行分析,得到人发出的音频信号和音响发出的音频信号;
反馈抑制器,用于对所述音响发出的音频信号进行衰减,从而实现声反馈抑制。
在本实施例中,通过采用声纹识别技术区分出人发出的音频信号和音响发出的音频信号,并采用反馈抑制器对所述音响发出的音频信号进行衰减,能够保证不失真的同时,还能够实现高增益的效果,从而解决了现有技术存在的声音失真和增益小的缺陷。
需要说明的是,所述拾音设备包括但不限于麦克风和话筒,这里不做具体限定。
优选的,所述分析模块包括:
特征提取模块,用于对所述音频信号进行特征提取,得到声纹特征;
识别模块,用于将所述声纹特征输入至预设的声纹识别模型中进行识别,得到人发出的音频信号和音响发出的音频信号。
在本实施例中,由于不同类型的音频信号具有不同的声纹特征,通过提取音频信号的声纹特征,能够准确识别出音频信号的类型,此外,通过采用声纹识别模型对声纹特征进行识别,能够提高识别的效率和准确率。
优选的,所述特征提取模块包括:
转换模块,用于对所述音频信号进行快速傅里叶转换,得到转换后的音频信号;
滤波模块,用于对所述转换后的音频信号进行滤波处理,得到所述音频信号对应的声纹能量,并将所述音频信号对应的声纹能量确定为所述音频信号对应的声纹特征。
在本实施例中,由于不同类型的音频信号具有不同的声纹能量,通过将声纹能量确定为声纹特征,能够进一步提高声纹识别的准确度,从而也进一步提高声反馈抑制的准确度。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于声纹识别技术的声反馈抑制方法,其特征在于,具体包括以下步骤:
步骤S1,拾音设备采集音频信号;
步骤S2,依据声纹识别技术对所述音频信号进行分析,得到人发出的音频信号和音响发出的音频信号;
步骤S3,采用反馈抑制器对所述音响发出的音频信号进行衰减,从而实现声反馈抑制。
2.根据权利要求1所述的一种基于声纹识别技术的声反馈抑制方法,其特征在于,所述步骤S2具体包括以下步骤:
步骤S21,对所述音频信号进行特征提取,得到声纹特征;
步骤S22,将所述声纹特征输入至预设的声纹识别模型中进行识别,得到人发出的音频信号和音响发出的音频信号。
3.根据权利要求2所述的一种基于声纹识别技术的声反馈抑制方法,其特征在于,所述步骤S21具体包括以下步骤:
步骤S211,对所述音频信号进行快速傅里叶转换,得到转换后的音频信号;
步骤S212,对所述转换后的音频信号进行滤波处理,得到所述音频信号对应的声纹能量,并将所述音频信号对应的声纹能量确定为所述音频信号对应的声纹特征。
4.根据权利要求3所述的一种基于声纹识别技术的声反馈抑制方法,其特征在于,所述声纹识别模型生成的方式具体包括以下步骤:
获取人发出的音频信号样本数据和音响发出的音频信号样本数据;
创建神经网络模型,将所述人发出的音频信号样本数据和音响发出的音频信号样本数据输入至所述神经网络模型中训练,得到声纹识别模型。
5.根据权利要求4所述的一种基于声纹识别技术的声反馈抑制方法,其特征在于,所述神经网络模型采用RNN模型、DNN模型或CNN模型。
6.一种基于声纹识别技术的声反馈抑制系统,其特征在于,所述系统包括:
拾音设备,用于采集音频信号;
分析模块,用于依据声纹识别技术对所述音频信号进行分析,得到人发出的音频信号和音响发出的音频信号;
反馈抑制器,用于对所述音响发出的音频信号进行衰减,从而实现声反馈抑制。
7.根据权利要求6所述的一种基于声纹识别技术的声反馈抑制系统,其特征在于,所述分析模块包括:
特征提取模块,用于对所述音频信号进行特征提取,得到声纹特征;
识别模块,用于将所述声纹特征输入至预设的声纹识别模型中进行识别,得到人发出的音频信号和音响发出的音频信号。
8.根据权利要求7所述的一种基于声纹识别技术的声反馈抑制系统,其特征在于,所述特征提取模块包括:
转换模块,用于对所述音频信号进行快速傅里叶转换,得到转换后的音频信号;
滤波模块,用于对所述转换后的音频信号进行滤波处理,得到所述音频信号对应的声纹能量,并将所述音频信号对应的声纹能量确定为所述音频信号对应的声纹特征。
CN202110931690.2A 2021-08-13 2021-08-13 一种基于声纹识别技术的声反馈抑制方法及系统 Pending CN113490115A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110931690.2A CN113490115A (zh) 2021-08-13 2021-08-13 一种基于声纹识别技术的声反馈抑制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110931690.2A CN113490115A (zh) 2021-08-13 2021-08-13 一种基于声纹识别技术的声反馈抑制方法及系统

Publications (1)

Publication Number Publication Date
CN113490115A true CN113490115A (zh) 2021-10-08

Family

ID=77945315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110931690.2A Pending CN113490115A (zh) 2021-08-13 2021-08-13 一种基于声纹识别技术的声反馈抑制方法及系统

Country Status (1)

Country Link
CN (1) CN113490115A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115065913A (zh) * 2022-06-22 2022-09-16 广州市迪声音响有限公司 一种基于声纹筛技术的不拾取音箱能量的拾音装置
CN115064176A (zh) * 2022-06-22 2022-09-16 广州市迪声音响有限公司 一种声纹筛系统及方法
CN115065912A (zh) * 2022-06-22 2022-09-16 广州市迪声音响有限公司 基于声纹筛技术的对音箱能量进行筛选的反馈抑制装置
CN116233697A (zh) * 2022-04-19 2023-06-06 中国科学院声学研究所 一种基于深度学习的声反馈的抑制方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717772A (en) * 1995-08-07 1998-02-10 Motorola, Inc. Method and apparatus for suppressing acoustic feedback in an audio system
CN108564956A (zh) * 2018-03-26 2018-09-21 京北方信息技术股份有限公司 一种声纹识别方法和装置、服务器、存储介质
CN108831440A (zh) * 2018-04-24 2018-11-16 中国地质大学(武汉) 一种基于机器学习及深度学习的声纹降噪方法及系统
CN109785852A (zh) * 2018-12-14 2019-05-21 厦门快商通信息技术有限公司 一种增强说话人语音的方法及系统
CN111462756A (zh) * 2019-01-18 2020-07-28 北京猎户星空科技有限公司 声纹识别方法、装置、电子设备及存储介质
CN112216300A (zh) * 2020-09-25 2021-01-12 三一专用汽车有限责任公司 用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车
CN112349291A (zh) * 2020-09-29 2021-02-09 成都千立网络科技有限公司 基于ai降噪模型的扩声系统及方法
CN112687276A (zh) * 2021-03-11 2021-04-20 北京世纪好未来教育科技有限公司 一种音频信号处理方法、装置及存储介质
CN112786059A (zh) * 2021-03-11 2021-05-11 合肥市清大创新研究院有限公司 一种基于人工智能的声纹特征提取方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717772A (en) * 1995-08-07 1998-02-10 Motorola, Inc. Method and apparatus for suppressing acoustic feedback in an audio system
CN108564956A (zh) * 2018-03-26 2018-09-21 京北方信息技术股份有限公司 一种声纹识别方法和装置、服务器、存储介质
CN108831440A (zh) * 2018-04-24 2018-11-16 中国地质大学(武汉) 一种基于机器学习及深度学习的声纹降噪方法及系统
CN109785852A (zh) * 2018-12-14 2019-05-21 厦门快商通信息技术有限公司 一种增强说话人语音的方法及系统
CN111462756A (zh) * 2019-01-18 2020-07-28 北京猎户星空科技有限公司 声纹识别方法、装置、电子设备及存储介质
CN112216300A (zh) * 2020-09-25 2021-01-12 三一专用汽车有限责任公司 用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车
CN112349291A (zh) * 2020-09-29 2021-02-09 成都千立网络科技有限公司 基于ai降噪模型的扩声系统及方法
CN112687276A (zh) * 2021-03-11 2021-04-20 北京世纪好未来教育科技有限公司 一种音频信号处理方法、装置及存储介质
CN112786059A (zh) * 2021-03-11 2021-05-11 合肥市清大创新研究院有限公司 一种基于人工智能的声纹特征提取方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116233697A (zh) * 2022-04-19 2023-06-06 中国科学院声学研究所 一种基于深度学习的声反馈的抑制方法及系统
CN116233697B (zh) * 2022-04-19 2023-09-05 中国科学院声学研究所 一种基于深度学习的声反馈的抑制方法及系统
CN115065913A (zh) * 2022-06-22 2022-09-16 广州市迪声音响有限公司 一种基于声纹筛技术的不拾取音箱能量的拾音装置
CN115064176A (zh) * 2022-06-22 2022-09-16 广州市迪声音响有限公司 一种声纹筛系统及方法
CN115065912A (zh) * 2022-06-22 2022-09-16 广州市迪声音响有限公司 基于声纹筛技术的对音箱能量进行筛选的反馈抑制装置

Similar Documents

Publication Publication Date Title
CN113490115A (zh) 一种基于声纹识别技术的声反馈抑制方法及系统
JP6553111B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN102216984B (zh) 噪声门、声音采集装置及噪声消除方法
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
US20070104335A1 (en) Acoustic feedback suppression for audio amplification systems
CN103124165A (zh) 自动增益控制
CN204482023U (zh) 一种啸叫抑制系统
CN112004177A (zh) 一种啸叫检测方法、麦克风音量调节方法及介质
CN108231088B (zh) 一种应用于语音数字信号的快速自动增益控制方法和装置
US20240177726A1 (en) Speech enhancement
GB2585086A (en) Pre-processing for automatic speech recognition
CN111526469A (zh) 一种基于神经网络的扩声系统啸叫点检测方法
CN105869656B (zh) 一种语音信号清晰度的确定方法及装置
CN110718229A (zh) 录音回放攻击的检测方法及对应检测模型的训练方法
WO2017045512A1 (zh) 一种语音识别的方法、装置、终端及语音识别设备
CN112820312B (zh) 一种语音分离方法、装置及电子设备
CN112349291A (zh) 基于ai降噪模型的扩声系统及方法
WO2020107455A1 (zh) 语音处理方法、装置、存储介质及电子设备
CN109862463A (zh) 耳机语音回放方法、耳机及其计算机可读存储介质
WO2023287782A1 (en) Data augmentation for speech enhancement
WO2020238703A1 (zh) 获取语音信号的方法及装置
JP4510539B2 (ja) 特定話者音声出力装置及び特定話者判定プログラム
CN114189781A (zh) 双麦神经网络降噪耳机的降噪方法及系统
CN111833894A (zh) 基于远场拾音模型的远场拾音方法及系统
Zhang et al. Neural network augmented kalman filter for robust acoustic howling suppression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211008