CN111833894A - 基于远场拾音模型的远场拾音方法及系统 - Google Patents

基于远场拾音模型的远场拾音方法及系统 Download PDF

Info

Publication number
CN111833894A
CN111833894A CN202010719648.XA CN202010719648A CN111833894A CN 111833894 A CN111833894 A CN 111833894A CN 202010719648 A CN202010719648 A CN 202010719648A CN 111833894 A CN111833894 A CN 111833894A
Authority
CN
China
Prior art keywords
sound
filtering
far
model
wave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010719648.XA
Other languages
English (en)
Inventor
虞焰兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Semxum Information Technology Co ltd
Original Assignee
Anhui Semxum Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Semxum Information Technology Co ltd filed Critical Anhui Semxum Information Technology Co ltd
Priority to CN202010719648.XA priority Critical patent/CN111833894A/zh
Publication of CN111833894A publication Critical patent/CN111833894A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了基于远场拾音模型的远场拾音方法及系统,涉及拾音技术领域。本发明包括通过无声噪音模型以及放大比例曲线确定远场拾音模型;采集有声波形并过滤掉回音以及超声波获取回音过滤音波;根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;根据放大比例曲线对无声过滤音波放大后播放。本发明通过训练模块预先训练好远场拾音模型;通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,实现对会场内回声的有效过滤的同时保证不是真,适应室内远程语音讲播,便捷实用。

Description

基于远场拾音模型的远场拾音方法及系统
技术领域
本发明属于拾音技术领域,特别是涉及一种基于远场拾音模型的远场拾音方法及系统。
背景技术
在政府报告大会以及重要的学术会议时,由于报告厅或会议室空间较大,常常会产生回声影响台下观众对讲演者的声音的辨识。现有技术也有对回声的过滤,为了让观众能够听清声音常采用放大器进行放大;但是,由于,声音的延时,声波在传递过程中波频会降低,如果放大器放大比例固定唯一,会导致声音失真。
为解决上述问题,本发明提供一种基于远场拾音模型的远场拾音方法及系统。
发明内容
本发明的目的在于提供基于远场拾音模型的远场拾音方法及系统,通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,解决背景技术中提出的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为基于远场拾音模型的远场拾音方法,包括如下步骤:
步骤一:在无人说话的情况下拾取海量无声噪音波形作为无声样本,对海量无声噪音波形训练获取无声噪音模型;
步骤二:在有人说话的情况下拾取海量有声波形作为有声样本,对海量有声波形测试获取声波-衰减曲线;
步骤三:根据声波-衰减曲线确定声音距离放大比例曲线;
步骤四:通过无声噪音模型以及放大比例曲线确定远场拾音模型;
步骤五:采集有声波形并过滤掉回音以及超声波获取回音过滤音波;
步骤六:根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;
步骤七:根据放大比例曲线对无声过滤音波放大后播放。
优选地,步骤一中无声噪声模型通过对不同位置的海量无声噪声音波取平均值获取无声噪音模型。
优选地,步骤二中对海量有声波形测试获取声波-衰减曲线具体过程如下:
获取海量所述有声波形距离声源不同距离位置的波频;计算海量所述有声波形距离声源不同距离位置的波频均值;根据距离声源不同距离位置的波频均值与有声波形的波频比值获取声波-衰减曲线。
优选地,步骤三包括如下过程:
将声波-衰减曲线对应的值取倒数获取放大比例曲线。
基于远场拾音模型的远场拾音系统,包括:声音采集模块、双声道过滤模块、声音放大模块、播放模块、存储模块;所述声音采集模块,用于采集有声波形并传递至双声道过滤模块;所述双声道过滤模块,用于过滤回音以及超声波获取回音过滤音波,还用于根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;所述声音放大模块,用于根据放大比例曲线对无声过滤音波放大;所述播放模块,用于将放大后的无声过滤音波播放;所述存储模块,用于存储预先训练完成的远场拾音模型;所述远场拾音模型包括无声噪音模型以及放大比例曲线。
优选地,还包括模型训练模块;所述模型训练模块,用于对海量无声噪音波形训练获取无声噪音模型;所述模型训练模块,用于海量有声波形测试获取声波-衰减曲线;所述模型训练模块,用于根据声波-衰减曲线确定声音距离放大比例曲线。
本发明具有以下有益效果:
本发明通过训练模块预先训练好远场拾音模型;通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,实现对会场内回声的有效过滤的同时保证不是真,适应室内远程语音讲播,便捷实用。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于远场拾音模型的远场拾音方法的流程图;
图2为本发明的基于远场拾音模型的远场拾音系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为基于远场拾音模型的远场拾音方法,包括如下步骤:
步骤一:在无人说话的情况下拾取海量无声噪音波形作为无声样本,对海量无声噪音波形训练获取无声噪音模型;具体的,无声噪声模型通过对不同位置的海量无声噪声音波取平均值获取无声噪音模型;
步骤二:在有人说话的情况下拾取海量有声波形作为有声样本,对海量有声波形测试获取声波-衰减曲线;具体的,获取海量有声波形距离声源不同距离位置的波频;计算海量有声波形距离声源不同距离位置的波频均值;根据距离声源不同距离位置的波频均值与有声波形的波频比值获取声波-衰减曲线;
步骤三:根据声波-衰减曲线确定声音距离放大比例曲线;具体的,将声波-衰减曲线对应的值取倒数获取放大比例曲线;
步骤四:通过无声噪音模型以及放大比例曲线确定远场拾音模型;
步骤五:采集有声波形并过滤掉回音以及超声波获取回音过滤音波;
步骤六:根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;
步骤七:根据放大比例曲线对无声过滤音波放大后播放。
请参阅图2所示,基于远场拾音模型的远场拾音系统,包括:声音采集模块、双声道过滤模块、声音放大模块、播放模块、存储模块;
声音采集模块,用于采集有声波形并传递至双声道过滤模块;双声道过滤模块,用于过滤回音以及超声波获取回音过滤音波,还用于根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;声音放大模块,用于根据放大比例曲线对无声过滤音波放大;播放模块,用于将放大后的无声过滤音波播放;存储模块,用于存储预先训练完成的远场拾音模型;远场拾音模型包括无声噪音模型以及放大比例曲线。
另外,还包括模型训练模块;模型训练模块,用于对海量无声噪音波形训练获取无声噪音模型;模型训练模块,用于海量有声波形测试获取声波-衰减曲线;模型训练模块,用于根据声波-衰减曲线确定声音距离放大比例曲线。
本发明实际使用时,通过训练模块预先训练好远场拾音模型;通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,实现对会场内回声的有效过滤的同时保证不是真,适应室内远程语音讲播,便捷实用。
值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (6)

1.基于远场拾音模型的远场拾音方法,其特征在于,包括如下步骤:
步骤一:在无人说话的情况下拾取海量无声噪音波形作为无声样本,对海量无声噪音波形训练获取无声噪音模型;
步骤二:在有人说话的情况下拾取海量有声波形作为有声样本,对海量有声波形测试获取声波-衰减曲线;
步骤三:根据声波-衰减曲线确定声音距离放大比例曲线;
步骤四:通过无声噪音模型以及放大比例曲线确定远场拾音模型;
步骤五:采集有声波形并过滤掉回音以及超声波获取回音过滤音波;
步骤六:根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;
步骤七:根据放大比例曲线对无声过滤音波放大后播放。
2.根据权利要求1所述的基于远场拾音模型的远场拾音方法,其特征在于,步骤一中无声噪声模型通过对不同位置的海量无声噪声音波取平均值获取无声噪音模型。
3.根据权利要求1或2所述的基于远场拾音模型的远场拾音方法,其特征在于,步骤二中对海量有声波形测试获取声波-衰减曲线具体过程如下:
获取海量所述有声波形距离声源不同距离位置的波频;计算海量所述有声波形距离声源不同距离位置的波频均值;根据距离声源不同距离位置的波频均值与有声波形的波频比值获取声波-衰减曲线。
4.根据权利要求3所述的基于远场拾音模型的远场拾音方法,其特征在于,步骤三包括如下过程:
将声波-衰减曲线对应的值取倒数获取放大比例曲线。
5.如权利要求1-4任意一所述的基于远场拾音模型的远场拾音系统,其特征在于,包括:声音采集模块、双声道过滤模块、声音放大模块、播放模块、存储模块;
所述声音采集模块,用于采集有声波形并传递至双声道过滤模块;
所述双声道过滤模块,用于过滤回音以及超声波获取回音过滤音波,还用于根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;
所述声音放大模块,用于根据放大比例曲线对无声过滤音波放大;
所述播放模块,用于将放大后的无声过滤音波播放;
所述存储模块,用于存储预先训练完成的远场拾音模型;所述远场拾音模型包括无声噪音模型以及放大比例曲线。
6.根据权利要求5所述的基于远场拾音模型的远场拾音方法,其特征在于,还包括模型训练模块;所述模型训练模块,用于对海量无声噪音波形训练获取无声噪音模型;所述模型训练模块,用于海量有声波形测试获取声波-衰减曲线;所述模型训练模块,用于根据声波-衰减曲线确定声音距离放大比例曲线。
CN202010719648.XA 2020-07-23 2020-07-23 基于远场拾音模型的远场拾音方法及系统 Withdrawn CN111833894A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010719648.XA CN111833894A (zh) 2020-07-23 2020-07-23 基于远场拾音模型的远场拾音方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010719648.XA CN111833894A (zh) 2020-07-23 2020-07-23 基于远场拾音模型的远场拾音方法及系统

Publications (1)

Publication Number Publication Date
CN111833894A true CN111833894A (zh) 2020-10-27

Family

ID=72925331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010719648.XA Withdrawn CN111833894A (zh) 2020-07-23 2020-07-23 基于远场拾音模型的远场拾音方法及系统

Country Status (1)

Country Link
CN (1) CN111833894A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112203180A (zh) * 2020-09-24 2021-01-08 安徽文香信息技术有限公司 一种智慧教室扩音器耳麦自适应音量调节系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112203180A (zh) * 2020-09-24 2021-01-08 安徽文香信息技术有限公司 一种智慧教室扩音器耳麦自适应音量调节系统及方法

Similar Documents

Publication Publication Date Title
Eaton et al. The ACE challenge—Corpus description and performance evaluation
CN102388416B (zh) 信号处理装置及信号处理方法
CN105516859B (zh) 消除回声的方法和系统
CN107221319A (zh) 一种语音识别测试系统和方法
WO2012053629A1 (ja) 音声処理装置及び音声処理方法
CN204482023U (zh) 一种啸叫抑制系统
CN109658935B (zh) 多通道带噪语音的生成方法及系统
CN110503967B (zh) 一种语音增强方法、装置、介质和设备
CN105845149A (zh) 声音信号中主音高的获取方法及系统
WO2020172828A1 (zh) 一种声源分离方法、装置及设备
CN107464563B (zh) 一种语音交互玩具
CN110650426A (zh) 麦克风阵列的非线性谐波失真检测方法、装置和存储介质
CN111696515B (zh) 一种用于教学录播的音频混音方法
Bolin et al. The influence of background sounds on loudness and annoyance of wind turbine noise
CN112863550A (zh) 基于注意力残差学习的哭声检测方法及系统
CN111833894A (zh) 基于远场拾音模型的远场拾音方法及系统
Guan et al. Libri-adhoc40: A dataset collected from synchronized ad-hoc microphone arrays
CN110718229A (zh) 录音回放攻击的检测方法及对应检测模型的训练方法
CN114189781A (zh) 双麦神经网络降噪耳机的降噪方法及系统
CN112349291A (zh) 基于ai降噪模型的扩声系统及方法
CN105261363A (zh) 一种语音识别的方法、装置及终端
CN116959491A (zh) 一种针对wav音频的分贝、回声、底噪及啸叫检测方法
CN111757235A (zh) 一种具有教室语言清晰度测量功能的扩声系统
GB2533248A (en) Method and apparatus for auscultating inaudible signals
CN109862463A (zh) 耳机语音回放方法、耳机及其计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201027