CN111833894A - 基于远场拾音模型的远场拾音方法及系统 - Google Patents
基于远场拾音模型的远场拾音方法及系统 Download PDFInfo
- Publication number
- CN111833894A CN111833894A CN202010719648.XA CN202010719648A CN111833894A CN 111833894 A CN111833894 A CN 111833894A CN 202010719648 A CN202010719648 A CN 202010719648A CN 111833894 A CN111833894 A CN 111833894A
- Authority
- CN
- China
- Prior art keywords
- sound
- filtering
- far
- model
- wave
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000001914 filtration Methods 0.000 claims abstract description 72
- 230000003321 amplification Effects 0.000 claims abstract description 38
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000012360 testing method Methods 0.000 claims description 8
- 238000002592 echocardiography Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了基于远场拾音模型的远场拾音方法及系统,涉及拾音技术领域。本发明包括通过无声噪音模型以及放大比例曲线确定远场拾音模型;采集有声波形并过滤掉回音以及超声波获取回音过滤音波;根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;根据放大比例曲线对无声过滤音波放大后播放。本发明通过训练模块预先训练好远场拾音模型;通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,实现对会场内回声的有效过滤的同时保证不是真,适应室内远程语音讲播,便捷实用。
Description
技术领域
本发明属于拾音技术领域,特别是涉及一种基于远场拾音模型的远场拾音方法及系统。
背景技术
在政府报告大会以及重要的学术会议时,由于报告厅或会议室空间较大,常常会产生回声影响台下观众对讲演者的声音的辨识。现有技术也有对回声的过滤,为了让观众能够听清声音常采用放大器进行放大;但是,由于,声音的延时,声波在传递过程中波频会降低,如果放大器放大比例固定唯一,会导致声音失真。
为解决上述问题,本发明提供一种基于远场拾音模型的远场拾音方法及系统。
发明内容
本发明的目的在于提供基于远场拾音模型的远场拾音方法及系统,通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,解决背景技术中提出的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为基于远场拾音模型的远场拾音方法,包括如下步骤:
步骤一:在无人说话的情况下拾取海量无声噪音波形作为无声样本,对海量无声噪音波形训练获取无声噪音模型;
步骤二:在有人说话的情况下拾取海量有声波形作为有声样本,对海量有声波形测试获取声波-衰减曲线;
步骤三:根据声波-衰减曲线确定声音距离放大比例曲线;
步骤四:通过无声噪音模型以及放大比例曲线确定远场拾音模型;
步骤五:采集有声波形并过滤掉回音以及超声波获取回音过滤音波;
步骤六:根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;
步骤七:根据放大比例曲线对无声过滤音波放大后播放。
优选地,步骤一中无声噪声模型通过对不同位置的海量无声噪声音波取平均值获取无声噪音模型。
优选地,步骤二中对海量有声波形测试获取声波-衰减曲线具体过程如下:
获取海量所述有声波形距离声源不同距离位置的波频;计算海量所述有声波形距离声源不同距离位置的波频均值;根据距离声源不同距离位置的波频均值与有声波形的波频比值获取声波-衰减曲线。
优选地,步骤三包括如下过程:
将声波-衰减曲线对应的值取倒数获取放大比例曲线。
基于远场拾音模型的远场拾音系统,包括:声音采集模块、双声道过滤模块、声音放大模块、播放模块、存储模块;所述声音采集模块,用于采集有声波形并传递至双声道过滤模块;所述双声道过滤模块,用于过滤回音以及超声波获取回音过滤音波,还用于根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;所述声音放大模块,用于根据放大比例曲线对无声过滤音波放大;所述播放模块,用于将放大后的无声过滤音波播放;所述存储模块,用于存储预先训练完成的远场拾音模型;所述远场拾音模型包括无声噪音模型以及放大比例曲线。
优选地,还包括模型训练模块;所述模型训练模块,用于对海量无声噪音波形训练获取无声噪音模型;所述模型训练模块,用于海量有声波形测试获取声波-衰减曲线;所述模型训练模块,用于根据声波-衰减曲线确定声音距离放大比例曲线。
本发明具有以下有益效果:
本发明通过训练模块预先训练好远场拾音模型;通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,实现对会场内回声的有效过滤的同时保证不是真,适应室内远程语音讲播,便捷实用。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于远场拾音模型的远场拾音方法的流程图;
图2为本发明的基于远场拾音模型的远场拾音系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为基于远场拾音模型的远场拾音方法,包括如下步骤:
步骤一:在无人说话的情况下拾取海量无声噪音波形作为无声样本,对海量无声噪音波形训练获取无声噪音模型;具体的,无声噪声模型通过对不同位置的海量无声噪声音波取平均值获取无声噪音模型;
步骤二:在有人说话的情况下拾取海量有声波形作为有声样本,对海量有声波形测试获取声波-衰减曲线;具体的,获取海量有声波形距离声源不同距离位置的波频;计算海量有声波形距离声源不同距离位置的波频均值;根据距离声源不同距离位置的波频均值与有声波形的波频比值获取声波-衰减曲线;
步骤三:根据声波-衰减曲线确定声音距离放大比例曲线;具体的,将声波-衰减曲线对应的值取倒数获取放大比例曲线;
步骤四:通过无声噪音模型以及放大比例曲线确定远场拾音模型;
步骤五:采集有声波形并过滤掉回音以及超声波获取回音过滤音波;
步骤六:根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;
步骤七:根据放大比例曲线对无声过滤音波放大后播放。
请参阅图2所示,基于远场拾音模型的远场拾音系统,包括:声音采集模块、双声道过滤模块、声音放大模块、播放模块、存储模块;
声音采集模块,用于采集有声波形并传递至双声道过滤模块;双声道过滤模块,用于过滤回音以及超声波获取回音过滤音波,还用于根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;声音放大模块,用于根据放大比例曲线对无声过滤音波放大;播放模块,用于将放大后的无声过滤音波播放;存储模块,用于存储预先训练完成的远场拾音模型;远场拾音模型包括无声噪音模型以及放大比例曲线。
另外,还包括模型训练模块;模型训练模块,用于对海量无声噪音波形训练获取无声噪音模型;模型训练模块,用于海量有声波形测试获取声波-衰减曲线;模型训练模块,用于根据声波-衰减曲线确定声音距离放大比例曲线。
本发明实际使用时,通过训练模块预先训练好远场拾音模型;通过双声道过滤模块对声音采集模块采集的有声波形进行回音以及超声波获取回音过滤音波;并根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;最后声音放大模块根据放大比例曲线对无声过滤音波放大,实现对会场内回声的有效过滤的同时保证不是真,适应室内远程语音讲播,便捷实用。
值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (6)
1.基于远场拾音模型的远场拾音方法,其特征在于,包括如下步骤:
步骤一:在无人说话的情况下拾取海量无声噪音波形作为无声样本,对海量无声噪音波形训练获取无声噪音模型;
步骤二:在有人说话的情况下拾取海量有声波形作为有声样本,对海量有声波形测试获取声波-衰减曲线;
步骤三:根据声波-衰减曲线确定声音距离放大比例曲线;
步骤四:通过无声噪音模型以及放大比例曲线确定远场拾音模型;
步骤五:采集有声波形并过滤掉回音以及超声波获取回音过滤音波;
步骤六:根据无声噪音模型对回音过滤音波进行无声噪音滤除处理获取无声过滤音波;
步骤七:根据放大比例曲线对无声过滤音波放大后播放。
2.根据权利要求1所述的基于远场拾音模型的远场拾音方法,其特征在于,步骤一中无声噪声模型通过对不同位置的海量无声噪声音波取平均值获取无声噪音模型。
3.根据权利要求1或2所述的基于远场拾音模型的远场拾音方法,其特征在于,步骤二中对海量有声波形测试获取声波-衰减曲线具体过程如下:
获取海量所述有声波形距离声源不同距离位置的波频;计算海量所述有声波形距离声源不同距离位置的波频均值;根据距离声源不同距离位置的波频均值与有声波形的波频比值获取声波-衰减曲线。
4.根据权利要求3所述的基于远场拾音模型的远场拾音方法,其特征在于,步骤三包括如下过程:
将声波-衰减曲线对应的值取倒数获取放大比例曲线。
5.如权利要求1-4任意一所述的基于远场拾音模型的远场拾音系统,其特征在于,包括:声音采集模块、双声道过滤模块、声音放大模块、播放模块、存储模块;
所述声音采集模块,用于采集有声波形并传递至双声道过滤模块;
所述双声道过滤模块,用于过滤回音以及超声波获取回音过滤音波,还用于根据无声噪音模型对回音过滤音波过滤获取无声过滤音波;
所述声音放大模块,用于根据放大比例曲线对无声过滤音波放大;
所述播放模块,用于将放大后的无声过滤音波播放;
所述存储模块,用于存储预先训练完成的远场拾音模型;所述远场拾音模型包括无声噪音模型以及放大比例曲线。
6.根据权利要求5所述的基于远场拾音模型的远场拾音方法,其特征在于,还包括模型训练模块;所述模型训练模块,用于对海量无声噪音波形训练获取无声噪音模型;所述模型训练模块,用于海量有声波形测试获取声波-衰减曲线;所述模型训练模块,用于根据声波-衰减曲线确定声音距离放大比例曲线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010719648.XA CN111833894A (zh) | 2020-07-23 | 2020-07-23 | 基于远场拾音模型的远场拾音方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010719648.XA CN111833894A (zh) | 2020-07-23 | 2020-07-23 | 基于远场拾音模型的远场拾音方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111833894A true CN111833894A (zh) | 2020-10-27 |
Family
ID=72925331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010719648.XA Withdrawn CN111833894A (zh) | 2020-07-23 | 2020-07-23 | 基于远场拾音模型的远场拾音方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111833894A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112203180A (zh) * | 2020-09-24 | 2021-01-08 | 安徽文香信息技术有限公司 | 一种智慧教室扩音器耳麦自适应音量调节系统及方法 |
-
2020
- 2020-07-23 CN CN202010719648.XA patent/CN111833894A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112203180A (zh) * | 2020-09-24 | 2021-01-08 | 安徽文香信息技术有限公司 | 一种智慧教室扩音器耳麦自适应音量调节系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eaton et al. | The ACE challenge—Corpus description and performance evaluation | |
CN102388416B (zh) | 信号处理装置及信号处理方法 | |
CN105516859B (zh) | 消除回声的方法和系统 | |
CN107221319A (zh) | 一种语音识别测试系统和方法 | |
WO2012053629A1 (ja) | 音声処理装置及び音声処理方法 | |
CN204482023U (zh) | 一种啸叫抑制系统 | |
CN109658935B (zh) | 多通道带噪语音的生成方法及系统 | |
CN110503967B (zh) | 一种语音增强方法、装置、介质和设备 | |
CN105845149A (zh) | 声音信号中主音高的获取方法及系统 | |
WO2020172828A1 (zh) | 一种声源分离方法、装置及设备 | |
CN107464563B (zh) | 一种语音交互玩具 | |
CN110650426A (zh) | 麦克风阵列的非线性谐波失真检测方法、装置和存储介质 | |
CN111696515B (zh) | 一种用于教学录播的音频混音方法 | |
Bolin et al. | The influence of background sounds on loudness and annoyance of wind turbine noise | |
CN112863550A (zh) | 基于注意力残差学习的哭声检测方法及系统 | |
CN111833894A (zh) | 基于远场拾音模型的远场拾音方法及系统 | |
Guan et al. | Libri-adhoc40: A dataset collected from synchronized ad-hoc microphone arrays | |
CN110718229A (zh) | 录音回放攻击的检测方法及对应检测模型的训练方法 | |
CN114189781A (zh) | 双麦神经网络降噪耳机的降噪方法及系统 | |
CN112349291A (zh) | 基于ai降噪模型的扩声系统及方法 | |
CN105261363A (zh) | 一种语音识别的方法、装置及终端 | |
CN116959491A (zh) | 一种针对wav音频的分贝、回声、底噪及啸叫检测方法 | |
CN111757235A (zh) | 一种具有教室语言清晰度测量功能的扩声系统 | |
GB2533248A (en) | Method and apparatus for auscultating inaudible signals | |
CN109862463A (zh) | 耳机语音回放方法、耳机及其计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201027 |