CN117278895B - 基于数据增强的麦克风信号优化方法及系统 - Google Patents
基于数据增强的麦克风信号优化方法及系统 Download PDFInfo
- Publication number
- CN117278895B CN117278895B CN202311549378.2A CN202311549378A CN117278895B CN 117278895 B CN117278895 B CN 117278895B CN 202311549378 A CN202311549378 A CN 202311549378A CN 117278895 B CN117278895 B CN 117278895B
- Authority
- CN
- China
- Prior art keywords
- sound box
- sound
- microphone
- main microphone
- transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000005457 optimization Methods 0.000 title claims abstract description 24
- 230000005540 biological transmission Effects 0.000 claims description 123
- 230000008054 signal transmission Effects 0.000 claims description 84
- 238000001914 filtration Methods 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 28
- 238000011156 evaluation Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 18
- 238000009826 distribution Methods 0.000 claims description 15
- 230000003044 adaptive effect Effects 0.000 claims description 12
- 230000002776 aggregation Effects 0.000 claims description 11
- 238000004220 aggregation Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims description 9
- 230000007613 environmental effect Effects 0.000 claims description 7
- 239000003086 colorant Substances 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 208000032369 Primary transmission Diseases 0.000 claims description 3
- 208000032370 Secondary transmission Diseases 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 9
- 238000009825 accumulation Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/03—Connection circuits to selectively connect loudspeakers or headphones to amplifiers
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明属于麦克风信号优化技术领域,具体涉及基于数据增强的麦克风信号优化方法及系统,本发明通过在会议进行中实时获取各麦克风采集的音频信息,并进行分解及音色提取,由此识别出主麦克风,进而对非主麦克风之外的其他麦克风进行关麦控制,使得只有主麦克风才能捕捉到演讲者的声音,避免其他麦克风造成的重叠起伏干扰,在一定程度上提高了声音信号的优化效果,同时在各音箱对应的有效放音区域内统计放音需求指数,同时将其结合各音箱与主麦克风的信号传输质量进行传输方式选择,实现了音箱传输方式的综合有效选择,从而在一定程度上增强了参会者的倾听体验感,有利于提升麦克风声音信号的增强价值。
Description
技术领域
本发明属于麦克风信号优化技术领域,具体涉及基于数据增强的麦克风信号优化方法及系统。
背景技术
麦克风凭借可以实时记录、传输和处理声音信息的特点广泛应用于电话通讯、会议、监控等领域中。特别是在大型会议中麦克风的应用需求更加明显,这是由于参会者分散在较大的场地中,如果没有麦克风对演讲者的声音进行放大,演讲者的声音很难传达到所有听众。
但由于大型会议通常伴随着人群嘈杂的环境,使得麦克风在捕捉演讲者声音的过程中不可避免地会捕捉到杂音,由于麦克风具有对捕捉声音放大的功能,也就无形之中对杂音进行了放大,由此造成对演讲者声音的巨大干扰,不仅会对声音传达的准确性造成影响,还会影响声音的远距离传达。在这种情况下,对麦克风捕捉的声音信号进行增强优化显得尤为必要。
现有技术中通过对麦克风捕捉的声音信号进行过滤处理,保留演讲者的声音,由此实现了声音信号的降噪优化,但这种优化方式忽略了会议室内通常会设置多个麦克风,每个麦克风对应一个参会者,当演讲者说话时不仅演讲者对应的麦克风会捕捉到演讲者的声音,其他麦克风也会捕捉到演讲者的声音,且由于其他麦克风与演讲者所在位置的距离不同,使得其他麦克风捕捉的声音放大程度不同,从而造成声音的重叠起伏干扰,在一定程度上影响了声音信号的优化效果,不利于声音的准确传达。
另外现有技术为了能够让会议室的每个角落都能够听到演讲者的声音,会在会议室内布设多个音箱,实现了麦克风捕捉声音信号在远距离上的增强传达,但受会议场地空间限制,麦克风与音箱之间的信号传输大多是无线传输,这种传输形式存在不稳定性,受信号传输质量的影响较大,基于这种情况现有技术在利用音箱进行声音信号传输时通常是根据信号传输质量选择传输方式,但其没有考虑到声音传输后是由人去倾听,如果没有人去倾听,那么进行声音信号增强就没有意义,导致忽略了音箱所在位置的参会人员分布状态,使得传输方式的选取依据过于片面,且没有凸显出重点,容易造成传输方式选取不适宜,从而在一定程度上影响了参会者的倾听体验感,不利于麦克风声音信号增强价值的有效体现。
发明内容
为此,本申请实施例的一个目的在于提供基于数据增强的麦克风信号优化方法及系统,有效解决了背景技术提到的问题。
本发明的目的可以通过以下技术方案来实现:本发明的第一方面提供基于数据增强的麦克风信号优化方法,包括以下步骤:(1)统计会议室内设置的麦克风数量,并将各麦克风按照设定的顺序进行编号。
(2)在会议进行中实时获取各麦克风采集的音频信息,并进行分解,得到各种声音,同时提取各种声音对应的发声特征,从中选取语音对应的声音,作为指定声音,进而对指定声音进行音色获取,得到各麦克风捕捉指定声音对应的音色,由此识别出目标音色及主麦克风,从而对非主麦克风之外的其他麦克风进行关麦控制。
(3)确定目标音色对应的声音,作为目标声音,由此对主麦克风采集的音频信息进行过滤处理,保留目标声音,并在处理后评价主麦克风对应的过滤性能指数,进而根据评价结果对主麦克风进行处理。
(4)统计会议室内布设的音箱数量,并将各音箱进行编号,同时定位各音箱的分布位置,由此划定各音箱对应的有效放音区域。
(5)在主麦克风运行过程中实时检测各音箱对主麦克风的信号传输指征,具体包括信号传输速度和信号传输强度,由此分析各音箱对主麦克风的信号传输质量系数。
(6)在主麦克风运行过程中实时监测各音箱对应有效放音区域的人员聚集数量和环境噪音响度,由此统计各音箱对应有效放音区域的放音需求指数。
(7)基于各音箱对主麦克风的信号传输质量系数和各音箱对应有效放音区域的放音需求指数对各音箱的传输方式进行控制。
根据本发明第一方面的一种能够实现的方式,所述目标音色及主麦克风的具体识别过程如下:将各麦克风捕捉指定声音对应的音色进行相互对比,由此将相同音色关联的麦克风进行归类,进而统计各音色对应的关联麦克风数量,从中选取最多关联麦克风数量对应的音色作为目标音色。
分别获取各麦克风捕捉目标声音对应的响度,进而取最大响度对应的麦克风作为主麦克风。
根据本发明第一方面的一种能够实现的方式,所述评价主麦克风对应的过滤性能指数具体实现过程如下:在过滤前获取主麦克风采集音频信息对应的内容参数,其中内容参数包括声音种类及各种声音对应的响度。
在过滤后获取主麦克风保留声音对应的内容参数,并与过滤前主麦克风采集音频信息对应的内容参数进行对比,利用评价公式计算出主麦克风对应的过滤性能指数/>,式中/>、/>分别表示为过滤前主麦克风采集音频信息中第i种声音对应的响度、过滤后主麦克风保留声音中第i种声音对应的响度,/>表示为声音种类编号,,e表示为自然常数,/>表示为过滤后主体麦克风保留声音对应的匹配度,/>的取值为0或1,其中/>的获取方式为:将过滤后主麦克风保留下的声音与目标声音进行匹配,若匹配成功,则/>取值为1,若匹配失败,则/>取值为0。
根据本发明第一方面的一种能够实现的方式,所述根据评价结果对主麦克风进行处理具体参见下述方式:通过评价公式获取主麦克风对应的理想过滤性能指数。
获取主麦克风的已使用年限,并基于主麦克风的型号规格获取主麦克风对应的有效使用年限,进而将主麦克风的已使用年限和有效使用年限结合主麦克风对应的理想过滤性能指数计算出主麦克风对应的达标过滤性能指数,计算表达式为。
将主麦克风对应的过滤性能指数与达标过滤性能指数进行对比,若主麦克风对应的过滤性能指数小于达标过滤性能指数,则对主麦克风进行更换处理。
根据本发明第一方面的一种能够实现的方式,所述划定各音箱对应的有效放音区域包括下述过程:获取音箱的规格型号,并据此获取音箱在水平和垂直方向的有效传播距离。
以各音箱的分布位置为圆心,以音箱在水平方向的有效传播距离为半径作圆,同时按照音箱在垂直方向的有效传播距离将所作圆进行垂直上下延伸,形成一个圆柱体区域。
获取会议室的长、宽和高,由此构建会议室的三维模型,并在三维模型中将会议室的边界线进行标识。
基于各音箱的分布位置将各音箱对应的圆柱体区域在会议室的三维模型中嵌入,由此识别各音箱对应的圆柱体区域中是否存在会议室的边界线,若某音箱对应的圆柱体区域中不存在会议室的边界线,则该音箱对应的圆柱体区域即为该音箱对应的有效放音区域,反之则从该音箱对应的圆柱体区域中提取会议室的边界线对圆柱体区域形成的分割区域,进而在该音箱对应的圆柱体区域中去除分割区域,保留下的区域作为该音箱对应的有效放音区域。
根据本发明第一方面的一种能够实现的方式,所述各音箱对主麦克风的信号传输质量系数分析公式为,式中/>、/>分别表示为第/>音箱对主麦克风的信号传输速度、信号传输强度,/>表示为音箱编号,/>,/>、/>分别表示为设定的参考信号传播速度、参考信号传输强度。
根据本发明第一方面的一种能够实现的方式,所述各音箱对应有效放音区域的放音需求指数统计表达式为,式中/>、/>分别表示为第j音箱对应有效放音区域的人员聚集数量、环境噪音响度,/>表示为第j音箱对应有效放音区域的体积,/>、/>分别表示为预先配置的参考人员聚集密度,安全环境噪音响度。
根据本发明第一方面的一种能够实现的方式,所述对各音箱的传输方式进行控制具体实施过程如下:将各音箱对应有效放音区域的放音需求指数与设置的临界放音需求指数进行对比,若某音箱对应有效放音区域的放音需求指数大于或等于临界放音需求指数,则将该音箱对应的放音需求等级设为一级需求,反之则将该音箱对应的放音需求等级设为二级需求。
将各音箱对主麦克风的信号传输质量系数与设置的临界信号传输质量系数进行对比,若某音箱对主麦克风的信号传输质量系数大于或等于临界信号传输质量系数,则将该音箱对应的信号传输等级设为一级传输,反之则将该音箱对应的信号传输等级设为二级传输。
将各音箱对应的放音需求等级与信号传输等级代入传输方式模型,得到各音箱对应的适配传输方式,模型中/>表示为信号传输等级为一级传输,/>表示为放音需求等级为一级需求,/>表示为放音需求等级为二级需求,/>表示为信号传输等级为二级传输。
按照各音箱对应的适配传输方式进行传输方式控制。
根据本发明第一方面的一种能够实现的方式,所述特殊传输包括音频有损传输和音频无损传输,其中特殊传输的具体选用过程如下:
将传输方式为特殊传输的音箱记为特定音箱,进而基于特定音箱的分布位置和主麦克风的设置位置获取特定音箱的传输距离,并将其结合特定音箱对应有效放音区域的人员聚集数量计算特定音箱对应的传输价值系数,其中,式中总传输距离是指所有音箱的传输距离总和,总人员聚集数量是指所有音箱对应有效放音区域内人员聚集数量总和,并将特定音箱对应的传输价值系数与设置的限定传输价值系数进行对比,若特定音箱对应有效放音区域的传输价值系数大于限定传输价值系数,则特定音箱对应的适配传输方式选用音频无损传输,反之则特定音箱对应的适配传输方式选用音频有损传输。
本发明的第二方面提出基于数据增强的麦克风信号优化系统,包括以下模块:会议室麦克风统计模块,用于统计会议室内设置的麦克风数量,并将各麦克风按照设定的顺序进行编号。
麦克风关麦控制模块,用于在会议进行中实时获取各麦克风采集的音频信息,由此识别出主麦克风,从而对非主麦克风之外的其他麦克风进行关麦控制。
麦克风过滤性能评价处理模块,用于对主麦克风采集的音频信息进行过滤处理,并在处理后评价主麦克风对应的过滤性能指数,进而根据评价结果对主麦克风进行处理。
音箱有效放音区域划定模块,用于统计会议室内布设的音箱数量,并将各音箱进行编号,同时定位各音箱的分布位置,由此划定各音箱对应的有效放音区域。
信号传输质量分析模块,用于在主麦克风运行过程中实时检测各音箱对主麦克风的信号传输指征,具体包括信号传输速度和信号传输强度,由此分析各音箱对主麦克风的信号传输质量系数。
放音需求统计模块,用于在主麦克风运行过程中实时监测各音箱对应有效放音区域的人员聚集数量和环境噪音响度,由此统计各音箱对应有效放音区域的放音需求指数。
音箱传输方式控制模块,用于基于各音箱对主麦克风的信号传输质量系数和各音箱对应有效放音区域的放音需求指数对各音箱的传输方式进行控制。
结合上述的所有技术方案,本发明所具备的优点为:1、本发明通过在会议进行中实时获取各麦克风采集的音频信息,并对采集的音频信息进行分解及音色提取,由此识别出主麦克风,进而对非主麦克风之外的其他麦克风进行关麦控制,使得只有主麦克风才能捕捉到演讲者的声音,避免其他麦克风造成的重叠起伏干扰,在一定程度上提高了声音信号的优化效果,有利于声音的准确传达。
2、本发明通过定位会议室内各音箱的布设位置由此划定各音箱对应的有效放音区域,进而在各音箱对应的有效放音区域内监测人员聚集数量和环境噪音响度,由此统计各音箱对应有效放音区域的放音需求指数,同时将其结合各音箱与主麦克风的信号传输质量进行传输方式选择,实现了音箱传输方式的综合有效选择,大大规避了现有传输方式选取依据过于片面且没有凸显重点的弊端,最大限度提高了传输方式选取与放音需求的适配度,从而在一定程度上增强了参会者的倾听体验感,有利于提升麦克风声音信号的增强价值。
3、本发明在对麦克风捕捉的音频信息进行过滤处理后还基于麦克风过滤性能的评价对麦克风进行处理,使得麦克风对音频信息的过滤效果能够得到量化展示,便于会议管理人员能够客观地了解麦克风的音频过滤效果是否达标,进而能够基于音频过滤效果实现了对麦克风的及时处理,避免出现麦克风音频过滤效果不达标时还继续使用对声音传达准确度造成的影响,从而从麦克风声音过滤层面提高了声音信号的优化效果。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的方法实施步骤流程图。
图2为本发明的系统模块连接示意图。
图3为本发明中音箱有效放音区域的划定示意图。
附图标记:1——有效放音区域,2——分割区域,3——会议室。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参见图1所示,本发明提供基于数据增强的麦克风信号优化方法,包括以下步骤:(1)统计会议室内设置的麦克风数量,并将各麦克风按照设定的顺序进行编号,每个麦克风都对应一个参会者。
(2)在会议进行中实时获取各麦克风采集的音频信息,并进行分解,得到各种声音,同时提取各种声音对应的发声特征,这里提到的发声特征为语音结构,从中选取语音对应的声音,作为指定声音,进而对指定声音进行音色获取,其中音色获取可以通过频谱分析或波形分析的方式获取,得到各麦克风捕捉指定声音对应的音色,由此识别出目标音色及主麦克风,从而对非主麦克风之外的其他麦克风进行关麦控制。
需要说明的是,麦克风在捕捉声音时不仅捕捉来自说话者的声音,还会捕捉周围环境中的其他声音,而本发明只需要说话者的声音,在这种情况下需要将说话者的声音与周围环境的声音进行区分,区分依据为人说话的声音和环境声音之间有一些显著的区别,这是由于人说话的声音是由人类生物体产生的,具有明确的语言结构,而环境声音是多种不同的物理过程和事件产生的,通常没有语言结构,由此通过对麦克风捕捉的各种声音进行发声特征提取,若识别到具有发声特征的声音,代表该声音为说话者发出的声音,即语音。
在上述方案的具体实施例中,目标音色及主麦克风的具体识别过程如下:将各麦克风捕捉指定声音对应的音色进行相互对比,由此将相同音色关联的麦克风进行归类,进而统计各音色对应的关联麦克风数量,从中选取最多关联麦克风数量对应的音色作为目标音色。
需要解释的是,本发明在识别目标音色时考虑到可能存在不同的人说话,就会存在多个指定声音,具体包括演讲者和其他参会者,其中演讲者的声音比较大,有很多麦克风都可以捕捉到,而其他参会者说话的声音比较小,能够捕捉到该声音的麦克风只有相应参会者对应的麦克风。
基于目标音色确定目标音色对应的声音,作为目标声音,由此分别获取各麦克风捕捉目标声音对应的响度,其中目标声音即为当前正在演讲的人声音,进而取最大响度对应的麦克风作为主麦克风。
需要知道的是主麦克风对应的是当前正在演讲的人员,在识别主麦克风时考虑到离当前正在演讲人员最近的麦克风捕捉的声音响度最大,由此通过声音响度就可以实现主麦克风的识别,一般来说主麦克风即为当前正在演讲人员对应的麦克风。
进一步需要理解的是,主麦克风在整个会议中是不断变化的,这是由于整个会议中会存在不同的演讲者。
本发明通过在会议进行中实时获取各麦克风采集的音频信息,并对采集的音频信息进行分解及音色提取,由此识别出主麦克风,进而对非主麦克风之外的其他麦克风进行关麦控制,使得只有主麦克风才能捕捉到演讲者的声音,避免其他麦克风造成的重叠起伏干扰,在一定程度上提高了声音信号的优化效果,有利于声音的准确传达。
(3)确定目标音色对应的声音,作为目标声音,由此对主麦克风采集的音频信息进行过滤处理,保留目标声音,并在处理后评价主麦克风对应的过滤性能指数,进而根据评价结果对主麦克风进行处理。
应用于上述实施例,评价主麦克风对应的过滤性能指数具体实现过程如下:在过滤前获取主麦克风采集音频信息对应的内容参数,其中内容参数包括声音种类及各种声音对应的响度。
在过滤后获取主麦克风保留声音对应的内容参数,并与过滤前主麦克风采集音频信息对应的内容参数进行对比,利用评价公式计算出主麦克风对应的过滤性能指数/>,式中/>、/>分别表示为过滤前主麦克风采集音频信息中第i种声音对应的响度、过滤后主麦克风保留声音中第i种声音对应的响度,/>表示为声音种类编号,,e表示为自然常数,/>表示为过滤后主体麦克风保留声音对应的匹配度,/>的取值为0或1,其中/>的获取方式为:将过滤后主麦克风保留下的声音与目标声音进行匹配,若匹配成功,则/>取值为1,若匹配失败,则/>取值为0。
在上述方案的示例中,过滤前主麦克风采集音频信息中除目标声音之外其他声音的响度与过滤后主麦克风保留声音中相应声音的响度差值越大,主麦克风的过滤性能越好。
在进一步地实施例中,根据评价结果对主麦克风进行处理具体参见下述方式:通过评价公式获取主麦克风对应的理想过滤性能指数,其中理想过滤性能指数具体获取方式为设定过滤后主麦克风只保留目标声音,且目标声音的响度与过滤前目标声音的响度保持一致,将其他声音的响度降为0,由此通过评价公式可以计算出主麦克风对应的理想过滤性能指数。
获取主麦克风的已使用年限,并基于主麦克风的型号规格从主麦克风的使用说明书中获取主麦克风对应的有效使用年限,进而将主麦克风的已使用年限和有效使用年限结合主麦克风对应的理想过滤性能指数计算出主麦克风对应的达标过滤性能指数,计算表达式为,其中主麦克风的已使用年限越短,达标过滤性能指数越接近理想过滤性能指数。
本发明在进行主麦克风达标过滤性能指数分析时不是直接将理想过滤性能指数作为达标过滤性能指数,而是考虑到随着主麦克风使用时长的增加,麦克风会存在功能老化,进而使得过滤性能在下降,如果直接以理想过滤性能指数作为达标过滤性能指数就会显得不合理,不贴合实际状态。
将主麦克风对应的过滤性能指数与达标过滤性能指数进行对比,若主麦克风对应的过滤性能指数小于达标过滤性能指数,则对主麦克风进行更换处理。
本发明在对麦克风捕捉的音频信息进行过滤处理后还基于麦克风过滤性能的评价对麦克风进行处理,使得麦克风对音频信息的过滤效果能够得到量化展示,便于会议管理人员能够客观地了解麦克风的音频过滤效果是否达标,进而能够基于音频过滤效果实现了对麦克风的及时处理,避免出现麦克风音频过滤效果不达标时还继续使用对声音传达准确度造成的影响,从而从麦克风声音过滤层面提高了声音信号的优化效果。
(4)统计会议室内布设的音箱数量,并将各音箱进行编号,同时定位各音箱的分布位置,由此划定各音箱对应的有效放音区域,具体划定过程如下:获取音箱的规格型号,据此从音箱的使用说明书中获取音箱在水平和垂直方向的有效传播距离。其中水平方向的有效传播距离决定了声音在水平面上的传播范围,垂直方向的有效传播距离决定了声音在垂直面上的传播范围。
以各音箱的分布位置为圆心,以音箱在水平方向的有效传播距离为半径作圆,同时按照音箱在垂直方向的有效传播距离将所作圆进行垂直上下延伸,形成一个圆柱体区域。
获取会议室的长、宽和高,由此构建会议室的三维模型,并在三维模型中将会议室的边界线进行标识。
基于各音箱的分布位置将各音箱对应的圆柱体区域在会议室的三维模型中嵌入,由此识别各音箱对应的圆柱体区域中是否存在会议室的边界线,若某音箱对应的圆柱体区域中不存在会议室的边界线,则该音箱对应的圆柱体区域即为该音箱对应的有效放音区域,反之则从该音箱对应的圆柱体区域中提取会议室的边界线对圆柱体区域形成的分割区域,进而在该音箱对应的圆柱体区域中去除分割区域,保留下的区域作为该音箱对应的有效放音区域,参见图3所示。
(5)在主麦克风运行过程中实时检测各音箱对主麦克风的信号传输指征,具体包括信号传输速度和信号传输强度,由此分析各音箱对主麦克风的信号传输质量系数,具体分析公式为,式中/>、/>分别表示为第/>音箱对主麦克风的信号传输速度、信号传输强度,/>表示为音箱编号,/>,/>、/>分别表示为设定的参考信号传播速度、参考信号传输强度,其中各音箱对主麦克风的信号传输速度越大、信号传输强度越强,信号传输质量系数越大。
(6)在主麦克风运行过程中实时监测各音箱对应有效放音区域的人员聚集数量和环境噪音响度,其中人员聚集数量可以通过在各音箱对应的有效放音区域设置监控摄像头采集人员聚集图像,进而从图像中统计得到,环境噪音响度可以在通过在各音箱对应的有效放音区域设置声音传感器,监测得到,由此统计各音箱对应有效放音区域的放音需求指数,统计表达式为,式中/>、/>分别表示为第j音箱对应有效放音区域的人员聚集数量、环境噪音响度,/>表示为第j音箱对应有效放音区域的体积,/>、/>分别表示为预先配置的参考人员聚集密度,安全环境噪音响度。
需要补充的是,本发明在统计放音需求指数时将有效放音区域的人员聚集数量和环境噪音响度作为统计依据,这是因为当人员聚集数量越多时对演讲者声音的倾听需求越高,当环境噪音响度越大时即使人员聚集数量少因环境噪音干扰导致倾听环境恶劣,使得对演讲者声音的倾听需求较高。
(7)基于各音箱对主麦克风的信号传输质量系数和各音箱对应有效放音区域的放音需求指数对各音箱的传输方式进行控制,具体实施过程如下:将各音箱对应有效放音区域的放音需求指数与设置的临界放音需求指数进行对比,若某音箱对应有效放音区域的放音需求指数大于或等于临界放音需求指数,则将该音箱对应的放音需求等级设为一级需求,反之则将该音箱对应的放音需求等级设为二级需求。
将各音箱对主麦克风的信号传输质量系数与设置的临界信号传输质量系数进行对比,若某音箱对主麦克风的信号传输质量系数大于或等于临界信号传输质量系数,则将该音箱对应的信号传输等级设为一级传输,反之则将该音箱对应的信号传输等级设为二级传输。
将各音箱对应的放音需求等级与信号传输等级代入传输方式模型,得到各音箱对应的适配传输方式,模型中/>表示为信号传输等级为一级传输,/>表示为放音需求等级为一级需求,/>表示为放音需求等级为二级需求,/>表示为信号传输等级为二级传输。
上述中特殊传输包括音频有损传输和音频无损传输,其中特殊传输的具体选用过程如下:将传输方式为特殊传输的音箱记为特定音箱,进而基于特定音箱的分布位置和主麦克风的设置位置获取特定音箱的传输距离,并将其结合特定音箱对应有效放音区域的人员聚集数量计算特定音箱对应的传输价值系数,其中,式中传输距离越远,人员聚集数量越多,传输价值系数越大,其中总传输距离是指所有音箱的传输距离总和,总人员聚集数量是指所有音箱对应有效放音区域内人员聚集数量总和,并将特定音箱对应的传输价值系数与设置的限定传输价值系数进行对比,若特定音箱对应有效放音区域的传输价值系数大于限定传输价值系数,则特定音箱对应的适配传输方式选用音频无损传输,反之则特定音箱对应的适配传输方式选用音频有损传输。
上述中在选用特殊传输时由于是处于信号传输质量不佳的状态下无法进行正常传输,因而要么选择音频有损传输,要么选择音频无损传输,此时借助特定音箱对应有效放音区域的人员聚集数量和传输距离进行传输价值分析,由此进行传输方式的针对性、合理性选取,这是因为当人员聚集数量越多时如果采用音频有损传输,就会存在较大比例的参会人员听到音质有损失的声音,难以满足会议的召开需求,当传输距离较远时参会人员本就存在听不清晰的负担,如果采用音频有损传输,在听不清晰的情况下还听不完整,就会加重远距离参会人员的倾听负担,因而需要在传输价值较大时选用音频无损传输,保障音频品质,在传输价值较小时可以选用音频有损传输,来提高传输效率,节省带宽和存储空间,便于后续的音频传输。
在上述方案的示例中,音频有损传输包括压缩传输、缓冲区管理等,音频无损传输包括采用数据冗余和纠错技术、使用数字音频接口等。
按照各音箱对应的适配传输方式进行传输方式控制。
本发明通过定位会议室内各音箱的布设位置由此划定各音箱对应的有效放音区域,进而在各音箱对应的有效放音区域内监测人员聚集数量和环境噪音响度,由此统计各音箱对应有效放音区域的放音需求指数,同时将其结合各音箱与主麦克风的信号传输质量进行传输方式选择,实现了音箱传输方式的综合有效选择,大大规避了现有传输方式选取依据过于片面且没有凸显重点的弊端,最大限度提高了传输方式选取与放音需求的适配度,从而在一定程度上增强了参会者的倾听体验感,有利于提升麦克风声音信号的增强价值。
实施例2
参照图2所示,本发明提出基于数据增强的麦克风信号优化系统,包括以下模块:会议室麦克风统计模块,用于统计会议室内设置的麦克风数量,并将各麦克风按照设定的顺序进行编号。
麦克风关麦控制模块,与会议室麦克风统计模块连接,用于在会议进行中实时获取各麦克风采集的音频信息,由此识别出主麦克风,从而对非主麦克风之外的其他麦克风进行关麦控制。
麦克风过滤性能评价处理模块,与麦克风关麦控制模块连接,用于对主麦克风采集的音频信息进行过滤处理,并在处理后评价主麦克风对应的过滤性能指数,进而根据评价结果对主麦克风进行处理。
音箱有效放音区域划定模块,用于统计会议室内布设的音箱数量,并将各音箱进行编号,同时定位各音箱的分布位置,由此划定各音箱对应的有效放音区域。
信号传输质量分析模块,分别与麦克风关麦控制模块和音箱有效放音区域划定模块连接,用于在主麦克风运行过程中实时检测各音箱对主麦克风的信号传输指征,具体包括信号传输速度和信号传输强度,由此分析各音箱对主麦克风的信号传输质量系数。
放音需求统计模块,与音箱有效放音区域划定模块连接,用于在主麦克风运行过程中实时监测各音箱对应有效放音区域的人员聚集数量和环境噪音响度,由此统计各音箱对应有效放音区域的放音需求指数。
音箱传输方式控制模块,分别与信号传输质量分析模块和放音需求统计模块连接,用于基于各音箱对主麦克风的信号传输质量系数和各音箱对应有效放音区域的放音需求指数对各音箱的传输方式进行控制。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本发明所定义的范围,均应属于本发明的保护范围。
Claims (9)
1.基于数据增强的麦克风信号优化方法,其特征在于,包括以下步骤:
(1)统计会议室内设置的麦克风数量,并将各麦克风按照设定的顺序进行编号;
(2)在会议进行中实时获取各麦克风采集的音频信息,并进行分解,得到各种声音,同时提取各种声音对应的发声特征,从中选取语音对应的声音,作为指定声音,进而对指定声音进行音色获取,得到各麦克风捕捉指定声音对应的音色,由此识别出目标音色及主麦克风,从而对主麦克风之外的其他麦克风进行关麦控制;
(3)确定目标音色对应的声音,作为目标声音,由此对主麦克风采集的音频信息进行过滤处理,保留目标声音,并在处理后评价主麦克风对应的过滤性能指数,进而根据评价结果对主麦克风进行处理;
(4)统计会议室内布设的音箱数量,并将各音箱进行编号,同时定位各音箱的分布位置,由此划定各音箱对应的有效放音区域;
(5)在主麦克风运行过程中实时检测各音箱对主麦克风的信号传输指征,具体包括信号传输速度和信号传输强度,由此分析各音箱对主麦克风的信号传输质量系数;
(6)在主麦克风运行过程中实时监测各音箱对应有效放音区域的人员聚集数量和环境噪音响度,由此统计各音箱对应有效放音区域的放音需求指数;
所述各音箱对应有效放音区域的放音需求指数统计表达式为,式中/>、/>分别表示为第j音箱对应有效放音区域的人员聚集数量、环境噪音响度,/>表示为第j音箱对应有效放音区域的体积,/>、/>分别表示为预先配置的参考人员聚集密度,安全环境噪音响度;
(7)基于各音箱对主麦克风的信号传输质量系数和各音箱对应有效放音区域的放音需求指数对各音箱的传输方式进行控制。
2.如权利要求1所述的基于数据增强的麦克风信号优化方法,其特征在于:所述目标音色及主麦克风的具体识别过程如下:
将各麦克风捕捉指定声音对应的音色进行相互对比,由此将相同音色关联的麦克风进行归类,进而统计各音色对应的关联麦克风数量,从中选取最多关联麦克风数量对应的音色作为目标音色;
分别获取各麦克风捕捉目标声音对应的响度,进而取最大响度对应的麦克风作为主麦克风。
3.如权利要求1所述的基于数据增强的麦克风信号优化方法,其特征在于:所述评价主麦克风对应的过滤性能指数具体实现过程如下:
在过滤前获取主麦克风采集音频信息对应的内容参数,其中内容参数包括声音种类及各种声音对应的响度;
在过滤后获取主麦克风保留声音对应的内容参数,并与过滤前主麦克风采集音频信息对应的内容参数进行对比,利用评价公式计算出主麦克风对应的过滤性能指数/>,式中/>、/>分别表示为过滤前主麦克风采集音频信息中第i种声音对应的响度、过滤后主麦克风保留声音中第i种声音对应的响度,/>表示为声音种类编号,,e表示为自然常数,/>表示为过滤后主体麦克风保留声音对应的匹配度,/>的取值为0或1,其中/>的获取方式为:
将过滤后主麦克风保留下的声音与目标声音进行匹配,若匹配成功,则取值为1,若匹配失败,则/>取值为0。
4.如权利要求1所述的基于数据增强的麦克风信号优化方法,其特征在于:所述根据评价结果对主麦克风进行处理具体参见下述方式:
通过评价公式获取主麦克风对应的理想过滤性能指数;
获取主麦克风的已使用年限,并基于主麦克风的型号规格获取主麦克风对应的有效使用年限,进而将主麦克风的已使用年限和有效使用年限结合主麦克风对应的理想过滤性能指数计算出主麦克风对应的达标过滤性能指数,计算表达式为;
将主麦克风对应的过滤性能指数与达标过滤性能指数进行对比,若主麦克风对应的过滤性能指数小于达标过滤性能指数,则对主麦克风进行更换处理。
5.如权利要求1所述的基于数据增强的麦克风信号优化方法,其特征在于:所述划定各音箱对应的有效放音区域包括下述过程:
获取音箱的规格型号,并据此获取音箱在水平和垂直方向的有效传播距离;
以各音箱的分布位置为圆心,以音箱在水平方向的有效传播距离为半径作圆,同时按照音箱在垂直方向的有效传播距离将所作圆进行垂直上下延伸,形成一个圆柱体区域;
获取会议室的长、宽和高,由此构建会议室的三维模型,并在三维模型中将会议室的边界线进行标识;
基于各音箱的分布位置将各音箱对应的圆柱体区域在会议室的三维模型中嵌入,由此识别各音箱对应的圆柱体区域中是否存在会议室的边界线,若某音箱对应的圆柱体区域中不存在会议室的边界线,则该音箱对应的圆柱体区域即为该音箱对应的有效放音区域,反之则从该音箱对应的圆柱体区域中提取会议室的边界线对圆柱体区域形成的分割区域,进而在该音箱对应的圆柱体区域中去除分割区域,保留下的区域作为该音箱对应的有效放音区域。
6.如权利要求1所述的基于数据增强的麦克风信号优化方法,其特征在于:所述各音箱对主麦克风的信号传输质量系数分析公式为,式中/>、/>分别表示为第/>音箱对主麦克风的信号传输速度、信号传输强度,/>表示为音箱编号,/>,、/>分别表示为设定的参考信号传播速度、参考信号传输强度。
7.如权利要求1所述的基于数据增强的麦克风信号优化方法,其特征在于:所述对各音箱的传输方式进行控制具体实施过程如下:
将各音箱对应有效放音区域的放音需求指数与设置的临界放音需求指数进行对比,若某音箱对应有效放音区域的放音需求指数大于或等于临界放音需求指数,则将该音箱对应的放音需求等级设为一级需求,反之则将该音箱对应的放音需求等级设为二级需求;
将各音箱对主麦克风的信号传输质量系数与设置的临界信号传输质量系数进行对比,若某音箱对主麦克风的信号传输质量系数大于或等于临界信号传输质量系数,则将该音箱对应的信号传输等级设为一级传输,反之则将该音箱对应的信号传输等级设为二级传输;
将各音箱对应的放音需求等级与信号传输等级代入传输方式模型,得到各音箱对应的适配传输方式,模型中/>表示为信号传输等级为一级传输,/>表示为放音需求等级为一级需求,/>表示为放音需求等级为二级需求,/>表示为信号传输等级为二级传输;
按照各音箱对应的适配传输方式进行传输方式控制。
8.如权利要求7所述的基于数据增强的麦克风信号优化方法,其特征在于:所述特殊传输包括音频有损传输和音频无损传输,其中特殊传输的具体选用过程如下:
将传输方式为特殊传输的音箱记为特定音箱,进而基于特定音箱的分布位置和主麦克风的设置位置获取特定音箱的传输距离,并将其结合特定音箱对应有效放音区域的人员聚集数量计算特定音箱对应的传输价值系数,其中,式中总传输距离是指所有音箱的传输距离总和,总人员聚集数量是指所有音箱对应有效放音区域内人员聚集数量总和,并将特定音箱对应的传输价值系数与设置的限定传输价值系数进行对比,若特定音箱对应有效放音区域的传输价值系数大于限定传输价值系数,则特定音箱对应的适配传输方式选用音频无损传输,反之则特定音箱对应的适配传输方式选用音频有损传输。
9.基于数据增强的麦克风信号优化系统,用于实现如权利要求1所述的基于数据增强的麦克风信号优化方法,其特征在于,包括以下模块:
会议室麦克风统计模块,用于统计会议室内设置的麦克风数量,并将各麦克风按照设定的顺序进行编号;
麦克风关麦控制模块,用于在会议进行中实时获取各麦克风采集的音频信息,由此识别出主麦克风,从而对主麦克风之外的其他麦克风进行关麦控制;
麦克风过滤性能评价处理模块,用于对主麦克风采集的音频信息进行过滤处理,并在处理后评价主麦克风对应的过滤性能指数,进而根据评价结果对主麦克风进行处理;
音箱有效放音区域划定模块,用于统计会议室内布设的音箱数量,并将各音箱进行编号,同时定位各音箱的分布位置,由此划定各音箱对应的有效放音区域;
信号传输质量分析模块,用于在主麦克风运行过程中实时检测各音箱对主麦克风的信号传输指征,具体包括信号传输速度和信号传输强度,由此分析各音箱对主麦克风的信号传输质量系数;
放音需求统计模块,用于在主麦克风运行过程中实时监测各音箱对应有效放音区域的人员聚集数量和环境噪音响度,由此统计各音箱对应有效放音区域的放音需求指数;
音箱传输方式控制模块,用于基于各音箱对主麦克风的信号传输质量系数和各音箱对应有效放音区域的放音需求指数对各音箱的传输方式进行控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311549378.2A CN117278895B (zh) | 2023-11-21 | 2023-11-21 | 基于数据增强的麦克风信号优化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311549378.2A CN117278895B (zh) | 2023-11-21 | 2023-11-21 | 基于数据增强的麦克风信号优化方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117278895A CN117278895A (zh) | 2023-12-22 |
CN117278895B true CN117278895B (zh) | 2024-01-26 |
Family
ID=89210877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311549378.2A Active CN117278895B (zh) | 2023-11-21 | 2023-11-21 | 基于数据增强的麦克风信号优化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117278895B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110191392A (zh) * | 2019-05-07 | 2019-08-30 | 广州市迪士普音响科技有限公司 | 一种虚拟现实扩声实现方法 |
CN113157246A (zh) * | 2021-06-25 | 2021-07-23 | 深圳小米通讯技术有限公司 | 音量调节方法、装置、电子设备及存储介质 |
CN113703714A (zh) * | 2021-10-29 | 2021-11-26 | 恒林家居股份有限公司 | 一种基于隔音墙的会议室声音控制方法和系统 |
-
2023
- 2023-11-21 CN CN202311549378.2A patent/CN117278895B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110191392A (zh) * | 2019-05-07 | 2019-08-30 | 广州市迪士普音响科技有限公司 | 一种虚拟现实扩声实现方法 |
CN113157246A (zh) * | 2021-06-25 | 2021-07-23 | 深圳小米通讯技术有限公司 | 音量调节方法、装置、电子设备及存储介质 |
CN113703714A (zh) * | 2021-10-29 | 2021-11-26 | 恒林家居股份有限公司 | 一种基于隔音墙的会议室声音控制方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117278895A (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110415681B (zh) | 一种语音识别效果测试方法及系统 | |
CN108229441B (zh) | 一种基于图像和语音分析的课堂教学自动反馈系统和反馈方法 | |
CN102843543B (zh) | 视频会议提醒方法、装置和视频会议系统 | |
CN108198562A (zh) | 一种用于实时定位辨识动物舍内异常声音的方法及系统 | |
CN206349145U (zh) | 音频信号处理设备 | |
CN113114750B (zh) | 基于大数据和云计算的多媒体数字化展厅智能调控云平台 | |
CN102929887A (zh) | 一种基于声音特征识别的快速录像检索方法及系统 | |
CN111696515B (zh) | 一种用于教学录播的音频混音方法 | |
CN110830901B (zh) | 一种用于调节扬声器音量的多通道扩声系统及方法 | |
CN109671430A (zh) | 一种语音处理方法及装置 | |
CN110475181B (zh) | 设备配置方法、装置、设备和存储介质 | |
CA3228068A1 (en) | Multi-source audio processing systems and methods | |
CN114584908B (zh) | 助听器的声学测试方法、装置以及设备 | |
CN116567513A (zh) | 一种基于滤波器的立体声耳机测试方法及系统 | |
CN117278895B (zh) | 基于数据增强的麦克风信号优化方法及系统 | |
CN116540178B (zh) | 一种音视频融合的噪声源定位方法及系统 | |
CN112788280A (zh) | 基于云计算和语音特征分析的智能会议媒体管理云平台 | |
CN116959491A (zh) | 一种针对wav音频的分贝、回声、底噪及啸叫检测方法 | |
CN111554325A (zh) | 一种嗓音识别方法及系统 | |
CN113657490B (zh) | 一种基于人工智能的门窗静音检测方法 | |
CN115410593A (zh) | 音频信道的选择方法、装置、设备及存储介质 | |
CN111328008B (zh) | 一种基于扩声系统的声压级智能控制方法 | |
CN115967894B (zh) | 一种话筒声音处理方法、系统、终端设备及存储介质 | |
CN216749300U (zh) | 一种声纹采集系统 | |
CN114979902B (zh) | 一种基于改进的变步长ddcs自适应算法的降噪拾音方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |