CN111163401B - 声音成分提取方法、降噪方法、装置及系统 - Google Patents
声音成分提取方法、降噪方法、装置及系统 Download PDFInfo
- Publication number
- CN111163401B CN111163401B CN202010102910.6A CN202010102910A CN111163401B CN 111163401 B CN111163401 B CN 111163401B CN 202010102910 A CN202010102910 A CN 202010102910A CN 111163401 B CN111163401 B CN 111163401B
- Authority
- CN
- China
- Prior art keywords
- sound
- signal
- noise reduction
- noise
- sound field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000009467 reduction Effects 0.000 title claims description 113
- 238000000605 extraction Methods 0.000 title claims description 70
- 238000012545 processing Methods 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims abstract description 24
- 238000005070 sampling Methods 0.000 claims abstract description 16
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 106
- 230000005236 sound signal Effects 0.000 claims description 57
- 238000012546 transfer Methods 0.000 claims description 48
- 239000013598 vector Substances 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 230000001133 acceleration Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 17
- 230000002829 reductive effect Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 11
- 230000007613 environmental effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000005314 correlation function Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/05—Detection of connection of loudspeakers or headphones to amplifiers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
一种声音成分提取方法及系统,通过传感装置获取声场信号,通过信号处理单元对所述声场信号的自功率谱进行奇异值分解,由此获得声场信号的不同声音成分。本申请,可通过对采样信号的分析,提取出需要的声场成分,对后续信号处理步骤中处理的信号数量进行限缩。通过本申请方法,可方便地获得用户敏感的声音成分,在后续信号处理过程中仅对该成分进行处理。由此,可大大减少系统计算量,减少滤波器数量,节约信号处理成本,并提高运算效率。
Description
技术领域
本申请涉及声学领域,尤其涉及对声场成分的处理。
背景技术
在声学领域,为了提高声学测试分析、噪声控制等工作的效率,或有针对性的对某一成分声音来源进行分析或利用,通常需要单独提取声场中的某一种或几种声音成分。在一些声学文献里,这种独立的声场成分分量也被称为部分场。
现有的声场成分提取技术,通常需要对采集的声场信号进行过滤,而后通过特殊的算法处理,才能够获得需要的声音成分。由于声音成分数据量大,现有的提取算法需要通过大量的矩阵运算,结合大量是声场数据才能有效提取特定的声场成分。其运算效率低下且硬件成本高昂。
发明内容
为了解决现有技术存在的不足,本申请的目的在于提供一种声音成分提取方法及系统。本申请所实现的对独立声场成分进行提取的工作更接近于对部分声场的分解,因而其具有运算量小、硬件要求低、运算延时少的特点。
首先,为实现上述目的,提出一种声音成分提取方法,步骤包括:获取至少一组声场信号的自功率谱Cxy。对所述自功率谱Cxx进行奇异值分解,获得对角矩阵∑(f)=UH(f)CxxU(f);其中,U(f)为所述声场信号到声音成分提取位置的传递矩阵;其中,所述对角矩阵∑(f)中对角线上的每一个元素分别为所述声场的一种声源成分。
可选的,上述方法还包括以下步骤:计算所述声场信号中所包含的声音成分,其计算步骤具体包括:利用特征传递向量计算所述声场信号所对应的声音成分vi(f);或者,利用特征传递向量计算声音成分vi(f)在位置M处的声音信号其中,所述声音成分vi(f)在一种方式下可表示为所述声音信号在一种方式下可表示为其中,特征传递向量为所述传递矩阵U(f)的第i列,对应所述对角矩阵∑(f)中对角线上第i种声源成分的特征向量,表示对角矩阵∑(f)中对角线上第i种声源成分从声源至采集点的传递特征。所述声场信号即声源信号,是在距离该声源信号的某一采集点位置M处由声源信号而产生的声音信号,M处是距离声源处的某一采集点的位置。
可选的,上述方法中,所述特征传递向量为所述传递矩阵U(f)的第i列,是对应所述对角矩阵∑(f)中需要提取的第i种声音成分的特征向量,表示所述对角矩阵∑(f)中对角线上第i种声源到获取所述声场信号的每一个采样点的传递关系。
可选的,上述的声音成分提取方法中,所述声场信号为所述声场的频域信号。所述各组声场信号分别由不同的传感装置在不同的采样位置采样后,进行频域信号转换计算而获得。
其次,为实现上述目的,还提出一种声音成分提取系统,包括信号处理单元以及至少一个传感装置,所述传感装置设置于至少一个采样位置,用于获取所述声场信号并将所述声场信号输入至所述信号处理单元;所述信号处理单元被设置为执行如上所述的声音成分提取方法。
可选的,上述的声音成分提取系统中,所述传感装置包括传声器、转速传感器、振动传感器、加速度传感器、压力传感器中的任一种或其组合。
可选的,上述的声音成分提取系统中,所述传感装置至少包括K个,K为预先由测试获得的工作场景下所获得的所述对角矩阵∑(f)中对角线上元素的数量。K可由实验获得:实验中,首先利用尽量多的传感装置进行声场信号的采集,而后按照上述步骤提取所采集的声场信号中的全部声音成分,获得所述对角矩阵Σ(f),由于对角线元素表征的其实是声音成分的能量值,而能量值低于一定阈值的声音成分可能其实是环境噪音,因此,所述对角矩阵∑(f)中对角线元素在大于该阈值的个数即可作为实际工程意义上声场信号所包含的独立声源数量。后期实施本申请时,则按照前期声源数量分析结果进行输入设备布放。
可选的,上述的声音成分提取系统中,还包括第一信号转换单元,所述第一信号转换单元连接所述传感装置,用于将所述传感装置采集的信号转化为数字信号。
可选的,上述的声音成分提取系统中,还包括第二信号转换单元,所述第二信号转换单元用于:对所述传感装置采集的模拟信号转化的数字信号进行频域信号转换计算,得到所述声场的频域信号,并输出至信号处理单元。其中,所述频域信号转换计算包括但不限于傅里叶变换,快速傅里叶变换。
有益效果
本申请所述的声场成分提取方法,无需对采集获得的声音信号进行过滤,本申请可直接由采集的频域上的声场信号进行声音成分提取,可按照信号处理的需要方便地提取一种或多种声音成分供后端处理单元进行分析计算。
本申请可基于两路声音信号,方便快捷地进行成分提取,降低了含有多个输入采集装置的声音成分提取系统的计算量。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。
附图说明
附图用来提供对本申请的进一步理解,并且构成说明书的一部分,并与本申请的实施例一起,用于解释本申请,并不构成对本申请的限制。在附图中:
图1为根据本申请申请一实施例提供的声音成分提取方法的流程图。
图2所示为本申请一实施例提供的一种降噪方法的流程示意图。
图3所示为本申请一实施例提供的一种降噪方法中获取降噪声音信号的流程示意图。
图4为根据本申请申请一实施例提供的降噪方法的原理示意图。
图5所示为本申请一实施例提供的一种声音成分提取装置的结构示意图。
图6所示为本申请一实施例提供的一种降噪装置的结构示意图。
图7所示为本申请一实施例提供的电子设备的结构示意图。
图8为根据本申请一实施例提供的声音成分提取系统的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请。
图1为根据本申请的声音成分提取方法的流程图。
首先,信号采集与处理过程中假设声场是相对固定不变的,也就是说,测量到的信号与提取到的分量之间的关系是时不变的。这样的运算场景下,可通过不同空间位置处测量的声压信号之间的交叉互谱矩阵,来计算统计相关函数。进而,通过该统计相关函数,可对声场进行统计特性分析,并以此提取到需要的声音成分。
首先通过采集到的声音信号,对声场进行统计特性分析。
这一步具体可选择通过计算各个声信号采集点中,任意两个信号组合的统计相关函数,分解出声场中包含多少统计上不相关的成分(即相互独立的声源的个数)。所述统计相关函数的作用是清楚知道从声源处到声源采集处,某一成分的变化关系。
为方便DSP等信号处理单元进行运算,可选择适当的运算放大器、数模转换器、频域信号转换单元对传感装置采样得到的模拟信号进行转换:首先将所述传感装置采集的模拟信号转化为数字信号,而后对所述数字信号通过傅里叶变换或快速傅里叶变换进行频域信号转换计算,进而得到所述声场的频域信号,例如,
本领域技术人员不难通过测量或计算获得T(f),即到的传递矩阵。这样就可以通过公式Cxy=T(f)Cxx方便地求解出所述声场信号的自功率谱Cxx,以此获取到该至少一组声场信号的自功率谱(步骤101)。对所述自功率谱进行奇异值分解(SVD分解),可获得对角矩阵(步骤102)。其中的∑(f)即为对角矩阵
该互谱矩阵Cxy是通过测量采集点处的输入信号计算出来的,其物理含义描述了两个信号采集点之间的变化关系或者说是相关性。或者说,该互谱矩阵Cxy描述的N个采样点上信号和的N个采样点上信号之间的关系,其包含有两个采样点之间的信号的延时以及两个采样点之间共有信号。通过SVD矩阵分解操作,可以将该Cxx公式中间的表达式分解为最右侧U(f)∑(f)UH(f)的表达式。其中,U(f)为表征至少一种声音成分到所述至少一个声场信号提取位置的声场变化(例如,幅值与相位的映射关系)的传递矩阵。
由此得到∑(f)=UH(f)CxxU(f)的对角矩阵。该对角矩阵中的对角线元素即为声场所包含的不同元素,即,所述声场信号所对应的声源成分,并且各元素之间线性无关。其中,∑(f)的对角线元素包含有声场的所有声源成分,不过∑(f)的对角线各元素仅包含声源成分的强度。如果需要进一步计算出每种声音成分或声音信号则可以通过进一步的换算获得。由此便可基于该对角矩阵,提取需要的声音成分(步骤103)。在本申请实施例的描述中,将不对声音成分、声源成分和声场成分的概念进行区分。
上述过程中,所述声场信号到声音成分提取位置的传递矩阵U(f)的计算过程与所述声场信号至另一声场信号的采样信号传递矩阵T(f)计算过程类似。以传递矩阵U(f)的计算过程为例,计算采样信号传递矩阵T(f)时仅需将计算的输入量替换为相应位置的声场信号即可。
上述全部步骤所获得的目的就是通过上述的公式演变与SVD分解(singularvalue decomposition),分析出有多少种不相关的声音成分。应当理解,这些声音成分的不相关性并非指的是时间(频率)意义上的|“不相关”,而是空间意义上的“不相关”。不相关的声音成分并非是不同声源发出来的声音,而是空间意义上相互独立的声音成分。同一个物理声源发出来的声音,可能会投影到多个空间上的独立分量上;不同声源发出的声音,可能在同一个分量上投影。因此,同一个物理声源发出的声音强度可能体现在对角矩阵的多个对角线元素的值;而同一个对角元素可能也体现了多个物理声源在该对应的空间的独立分量上的声音强度。
在本申请一实施例中,开发人员可以通过改变声场环境条件(例如调整不同物理声源的位置、不同物理声源的声音大小或不同物理声源的声音频率等)的实验方式来获得不同声场环境条件下的对角矩阵,通过对比不同声场环境条件下的对角矩阵的变化来得知物理声源与对角矩阵中对角线元素的对应关系,从而可在后续的处理过程中有针对性地提取与特定物理声源对应的声音成分。
在本申请另一实施例中,由于环境噪音的能量相对于实际物理声源的声音的能量一般要小很多,因此当发现对角矩阵中的一些对角线元素的值很低时,则这些对角线元素对应的实际物理声源其实是环境噪音。即使这些对角线元素中可能也包括了实际物理声源在对应空间的独立分量上投影的一些声音强度,但由于对角线元素的值很低,也并不会对后续针对这些实际物理声源的声音成分分析造成很大影响。这样可将对角线矩阵中低于阈值的对角线元素置为零,这样便可实现环境噪音的去除,以避免影响后续利用对角线矩阵进行的声音成分处理过程。
基于上述的分离过程所获得的结果,本领域技术人员可通过下述步骤很方便地进行特定声音成分的提取。
具体而言,在分析出原本声场中多个独立的声源成分所组成的集合∑(f)后,先根据实际应用需求确定需要提取那几种成分。例如,在一种应用场景下,处理器的运算量可以处理两个输入通道则可以提取能量最高的两个成分。在确定要提取的声场成分后,进一步得到根据采集点信号提取出每个独立声场成分信息的数学关系,即,由特征传递向量对所述声场信号进行计算,获得需要的声音成分vi(f)或声音信号
其中,表示由对角矩阵∑(f)中需要提取的第i种声音成分在声场信号提取位置M处产生的信号,为所述传递矩阵U(f)的第i列。是对应所述对角矩阵∑(f)中第i行或第i列所表示的声场信号中的第i种声音成分的特征向量。
图2所示为本申请一实施例提供的一种降噪方法的流程示意图。如图2所示,该降噪方法包括如下步骤:
步骤201:基于前述的声音成分提取方法计算出声场信号中与噪音对应的声音成分。
如前所述,基于设置在至少一个声场信号提取位置的至少一个传感装置采集到的至少一组声场信号利用前述的声音成分提取方法即可得到的对角矩阵中的对角线元素对应声音成分的强度。开发人员可通过可以通过改变声场环境条件的实验方式确定与噪音对应的声音成分,并利用传递矩阵U(f)计算出与噪音对应的声音成分。
步骤202:基于与噪音对应的声音成分生成用于抵消噪音的降噪声音信号。
基于与噪音对应的声音成分在降噪区域生成降噪声音信号可有效地实现在降噪区域的降噪。
步骤203:发送降噪声音信号。
降噪声音信号可以由设置在降噪区域的扬声器播放出来以实现主动降噪。
在本申请一实施例中,考虑到降噪区域与声场信号提取位置一般相距一定距离,基于前述声音成分提取方法计算出的与噪音对应的声音成分却是基于声场信号提取位置的声场信号获取的,因此如何在降噪区域实现降噪是需要解决的问题。具体而言,如图3所示,该基于与噪音对应的声音成分生成用于抵消噪音的降噪声音信号的过程可包括如下步骤:
由于Cxy=T(f)Cxx。通过本申请实施例所提供的声音成分提取方法已知Cxx=U∑UH。由此可得知传递矩阵T(f)可表示为T(f)=Cxy(f)U∑-1UH。
将上式展开可得到:
这样第i个声音成分到降噪区域的声场变化可表征为:
除了用于求得第i个声音成分在降噪区域的值外,将传递矩阵T(f)表示成上述形式还有如下好处:
a)对角矩阵的逆矩阵就等于对每一个对角元素取倒数,因此如果先对Cxx(f)作了奇异值分解,就可以快速地得到对角矩阵的逆矩阵。
b)如果对角矩阵∑中存在非常小的元素,取倒数后会被放大得十分厉害,这会导致结果异常(是因为这些对角线元素原本应该为0,如果为0的话,∑就不再可逆,但是舍去0降维后的矩阵是可逆的,由于环境噪音存在导致这些对角线元素不为0)。比如当某个对角线元素的值为10-10,其倒数将会是1010,原本应该忽略的误差项在求逆时对结果产生了剧烈的影响。通过将传递矩阵T(f)写成上述形式后,可以通过舍去取值非常小对角线元素和相应基底(例如,将对角矩阵的中低于阈值的对角线元素置为零)来确保求逆这个过程不会被这一现象所影响。
在本申请一实施例中,为了降低后续计算过程的计算量,考虑到声音成分提取过程主要针对的是噪音对应的声音成分,因此也可将除与噪音对应的声音成分对应之外的其他对角线元素置为零。
基于上面给出的公式,第i个声音成分在降噪区域的值便可表示为:
y(i)(f)=T(i)(f)x(f)
步骤304:基于传递矩阵T(f)以及传递矩阵G(f)计算降噪控制矩阵
W(f)=-G-1(f)T(f)
其中,G(f)为表征降噪控制矩阵W(f)输出的声音信号到降噪区域的声场变化的传递矩阵。
W为降噪控制矩阵,是一个多输入多输出的滤波器组,包括L1路传感装信号输入,和M路声音信号输出。由于降噪区域与噪音音源的物理位置之间可能有一定距离,且用于发出降噪声音信号的扬声器本身的频响不会是平直的,因此W所输出的声音信号还需要利用传递矩阵G(f)以进行额外的信号处理过程,以消除降噪区域与噪音音源的物理位置之间的距离所带来的信号传输损失,即降噪区域的所需要的降噪声音信号是基于W输出的声音信号再经过利用传递矩阵G的信号处理之后生成的。这里的G实际上表征了两个过程:扬声器作为物理器件如何响应收到的降噪声音信号;以及,扬声器发出的声波信号传递到降噪区间发生了怎样的变换。按照降噪控制矩阵W是固定的还是实时变换的,主动降噪可以分为非自适应和自适应的。本申请实施例谈论的降噪过程是非自适应的,即W是固定的。实际系统上,只有通过W这个过程是实时运算的。因此W的尺寸直接决定了实时参与运算的运算量。
Hv矩阵为声音成分提取矩阵(下标v是virtual的缩写,表示virtual source(虚拟声源),指代提取出的声音成分),用于实时执行前述实施例所提供的声音成分提取过程。至少一组信号通过这个矩阵Hv后,由原先的L1个元素变为了L3个元素的xv(f),xv(f)即为基于提取的与噪音对应的声音成分。相应地,控制器W尺寸也就变为了M×L3。由于L3比L1小,滤波器的数量也就减少了,从而提高了运算效率。
如前所述已知:
y(f)=T(f)x(f)
基于图4所示的结构可知降噪声音信号可表示为:
S(f)=G(f)W(f)xv(f)
已知降噪的目的是令在降噪区域测得的y(f)和降噪声音信号S(f)能够相互抵消,即,两个信号的叠加为0:
y(f)+S(f)=0
即
T(f)xv(f)+G(f)W(f)xv(f)=0
因此可以得出:
T(f)+G(f)W(f)=0
因此可以得出:
W(f)=-G-1(f)T(f)
基于前述得到的:
T(f)=Cxy(f)U∑-1UH
因此:
若G不是一个可逆方阵,将求逆矩阵运算替换为伪逆矩阵运算即可。传递矩阵G可通过前期测量过程获取。由于上述公式是在频域推导的,在实际场景中,在根据上式计算出降噪控制矩阵W后,还需要根据频域得到W进一步计算滤波器的时域参数,然后将W的参数写在DSP(数字信号处理器)里实时运行。
在本申请一实施例中,考虑到W和U之间存在上述对应关系,因此可预先计算并保存多种配置下的W和U的数据,这样在实际工作时便可根据不同的应用场景和不同的降噪目的来切换降噪配置。
步骤305:生成降噪声音信号S(f)=G(f)W(f)xv(f)。
当计算出降噪控制矩阵W后,基于图4所示的结构可得知降噪声音信号可表示为S(f)=G(f)W(f)xv(f)。将该降噪声音信号发送至设置在降噪区域的扬声器播放即可抵消降噪区域的与噪音对应的声音成分,由此实现主动降噪。应当理解,在不同的应用场景下,根据实际的场景需求扬声器也可设置在除降噪区域之外的其他位置,通过进一步调整降噪声音信号可以弥补扬声器位置和降噪区域之间距离所带来的损失,然而本申请对扬声器的具体设置位置不做严格限定。
图5所示为本申请一实施例提供的一种声音成分提取装置的结构示意图。如图5所示,该声音成分提取装置40包括:
对角矩阵获取模块402,配置为对自功率谱Cxx进行奇异值分解,获得对角矩阵∑(f)=UH(f)CxxU(f);
在本申请一实施例中,如图4所示,该声音成分提取装置40进一步包括:
在本申请一实施例中,声音成分计算模块403进一步配置为:利用特征传递向量计算对角矩阵∑(f)中需要提取的第i种声音成分vi(f);利用特征传递向量计算对角矩阵∑(f)中需要提取的第i种声音成分在至少一个声场信号提取位置处的声音信号其中,特征传递向量为传递矩阵U(f)的第i列。
在本申请一实施例中,声场信号为声场的频域信号;各组声场信号分别由不同的传感装置在不同的声场信号提取位置采样后,进行频域信号转换计算而获得。
图6所示为本申请一实施例提供的一种降噪装置的结构示意图。如图5所示,该降噪装置50包括:
噪音成分提取模块501,配置为基于如前任一所述的声音成分提取方法计算出声场信号中与噪音对应的声音成分;
降噪声音信号获取模块502,配置为基于与噪音对应的声音成分生成用于抵消噪音的降噪声音信号;以及
发送模块503,配置为发送降噪声音信号。
在本申请一实施例中,如图6所示,降噪声音信号获取模块502包括:
降噪控制矩阵计算单元5024,配置为基于传递矩阵T(f)以及传递矩阵G(f)计算降噪控制矩阵W(f)=-G-1(f)T(f),其中,G(f)为表征降噪控制矩阵W(f)输出的声音信号到降噪区域的声场变化的传递矩阵;以及
降噪信号计算单元5025,配置为生成降噪声音信号S(f)=G(f)W(f)xv(f)。
在本申请一实施例中,该降噪装置50可进一步包括:
置零模块504,配置为在基于与噪音对应的声音成分生成用于抵消噪音的降噪声音信号之前,将对角矩阵的中低于阈值的对角线元素置为零,和/或,将除与噪音对应的声音成分对应之外的其他对角线元素置为零。
上述声音成分提取装置40和降噪装置50中的各个模块的具体功能和操作已经在上面参考图1到图4描述的声音成分提取方法或降噪方法中进行了详细介绍。因此,这里将省略其重复描述。
需要说明的是,根据本申请实施例的声音成分提取装置40或降噪装置50可以作为一个软件模块和/或硬件模块而集成到电子设备60中,换言之,该电子设备60可以包括该声音成分提取装置40或降噪装置50。例如,该声音成分提取装置40或降噪装置50可以是该电子设备60的操作系统中的一个软件模块,或者可以是针对于其所开发的一个应用程序;当然,该声音成分提取装置40或降噪装置50同样可以是该电子设备60的众多硬件模块之一。
在本申请另一实施例中,该声音成分提取装置40或降噪装置50与该电子设备60也可以是分立的设备(例如,服务器),并且该声音成分提取装置40或降噪装置50可以通过有线和/或无线网络连接到该电子设备60,并且按照约定的数据格式来传输交互信息。
图7所示为本申请一实施例提供的电子设备的结构示意图。如图7所示,该电子设备60包括:一个或多个处理器601和存储器602;以及存储在存储器602中的计算机程序指令,计算机程序指令在被处理器601运行时使得处理器601执行如上述任一实施例的声音成分提取方法或降噪方法。
处理器601可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器602可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器601可以运行程序指令,以实现上文的本申请的各个实施例的声音成分提取方法或降噪方法中的步骤以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如光线强度、补偿光强度、滤光片的位置等信息。
在一个示例中,电子设备60还可以包括:输入装置603和输出装置604,这些组件通过总线系统和/或其他形式的连接机构(图5中未示出)互连。
例如,该输入装置603可包括分布在不同声场信号提取位置的多个传感器。在该电子设备是单机设备时,该输入装置603也可以是通信网络连接器,用于从外部的传感设备接收所采集的输入信号。该输出装置604可以向外部输出各种信息,例如可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备60中与本申请有关的组件中的一些,省略了诸如总线、输入装置/输出接口等组件。除此之外,根据具体应用情况,电子设备60还可以包括任何其他适当的组件。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行如上述任一实施例的声音成分提取方法或降噪方法中的步骤。
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本说明书上述“示例性声音成分提取方法或降噪方法”部分中描述的根据本申请各种实施例的声音成分提取方法或降噪方法中的步骤。
计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器((RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
上述声音成分提取方法的运算过程可基于图8所示的硬件系统实现。该系统包括信号处理单元以及传感装置。
首先,传感装置,或,具体可选择声音采集装置,例如麦克风,采集声音信号。采集后,首先经过模数转换器,进入滤波系统,滤波系统的硬件可由DSP/ARM等硬件板卡或芯片。声音信号进入滤波系统后,进行声场统计特性的分析,直至最后提取出指定的声音成分。
在不同应用场景下,具体可采用不同的传感装置作为系统的输入端。例如,应用于汽车驾驶舱内声音成分提取,可以采用转速传感器、加速度传感器、麦克风等单独或组合方式。此时,可预先通过实验获取所述传感装置采集的不同信号所对应的声场信号。
该装置还可以根据需要加入运算放大器,通过如下的运算流程获得需要的声音成分:
声信号进入运算放大器或相应的滤波系统→声场的统计特性分析→提取需要的声音成分。
在一种实现方式下,该分离装置可包含集成设置的或分离设置的麦克风、运算放大器、模数转换器、DSP等硬件及线路。或者,所述分离装置可包含麦克风、模数转换器、arm芯片等硬件及线路。或者,所述分离装置包含特殊用途传感器(如振动传感器、加速度传感器等,不限于上述两种),模数转换器、芯片等硬件及线路。
一般,系统可通过麦克风(传声器)采集空间中声场信号输入至芯片内进行处理。但是,例如,汽车驾驶舱内,可通过转速传感器(采集发动机转速)、振动传感器采集数据,进行校正。例如,转速数据可对应一个前期试验获得的声场模型,通过该声场模型对运算所需的输入信号进行校正。
本申请一实施例还提供一种降噪系统,包括:至少一个传感装置,分别设置于至少一个采样位置,分别用于获取一组声场信号并将声场信号输入至信号处理单元;信号处理单元,配置为基于如前任一的声音成分提取方法计算出声场信号中与噪音对应的声音成分;降噪声音信号获取模块502,配置为基于与噪音对应的声音成分生成用于抵消噪音的降噪声音信号;以及发送模块503,配置为将降噪声音信号发送给扬声器模块;以及扬声器模块,配置为外放降噪声音信号。
本申请技术方案的优点主要体现在:可通过对采样信号的分析,提取出需要的声场成分,对后续信号处理步骤中处理的信号数量进行限缩。本申请,可方便地获得用户敏感的声音成分,在后续信号处理过程中仅对该成分进行处理。由此,可大大减少系统计算量,减少滤波器数量,节约信号处理成本,并提高运算效率。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
本领域普通技术人员可以理解:以上所述仅为本申请的优选实施例而已,并不用于限制本申请,尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种声音成分提取方法,其特征在于,步骤包括:
对所述自功率谱Cxx进行奇异值分解,获得对角矩阵∑(f)=UH(f)CxxU(f);
2.如权利要求1所述的声音成分提取方法,其特征在于,所述声场信号为所述声场的频域信号;
各组所述声场信号分别由不同的传感装置在不同的声场信号提取位置采样后,进行频域信号转换计算而获得。
3.一种降噪方法,其特征在于,包括:
基于权利要求1或2所述的声音成分提取方法计算出声场信号中与噪音对应的所述声音成分;
基于所述与噪音对应的声音成分生成用于抵消所述噪音的降噪声音信号;以及
发送所述降噪声音信号。
4.根据权利要求3所述的方法,其特征在于,所述基于所述与噪音对应的声音成分生成用于抵消所述噪音的降噪声音信号包括:
基于所述传递矩阵T(f)以及传递矩阵G(f)计算降噪控制矩阵W(f)=-G-1(f)T(f),其中,G(f)为表征所述降噪控制矩阵W(f)输出的声音信号到所述降噪区域的声场变化的传递矩阵;以及
5.根据权利要求3所述的方法,其特征在于,在基于所述与噪音对应的声音成分的生成用于抵消所述噪音的降噪声音信号之前,进一步包括:
将所述对角矩阵的中低于阈值的对角线元素置为零;和/或,
将除与噪音对应的声音成分对应之外的其他对角线元素置为零。
6.一种声音成分提取装置,其特征在于,包括:
对角矩阵获取模块,配置为对所述自功率谱Cxx进行奇异值分解,获得对角矩阵∑(f)=UH(f)CxxU(f);以及
声音成分计算模块,配置为利用特征传递向量计算所述对角矩阵∑(f)中需要提取的第i种声音成分利用所述特征传递向量计算所述对角矩阵∑(f)中需要提取的第i种声音成分在所述至少一个声场信号提取位置处的声音信号
7.一种降噪装置,其特征在于,包括:
噪音成分提取模块,配置为基于权利要求1或2所述的声音成分提取方法计算出声场信号中与噪音对应的所述声音成分;
降噪声音信号获取模块,配置为基于所述与噪音对应的声音成分生成用于抵消所述噪音的降噪声音信号;以及
发送模块,配置为发送所述降噪声音信号。
8.一种声音成分提取系统,包括信号处理单元以及至少一个传感装置,其特征在于,
所述至少一个传感装置分别设置于至少一个采样位置,分别用于获取一组所述声场信号并将所述声场信号输入至所述信号处理单元;
所述信号处理单元被设置为执行如权利要求1或2所述的声音成分提取方法。
9.如权利要求8所述的声音成分提取系统,其特征在于,所述传感装置包括传声器、转速传感器、振动传感器、加速度传感器、压力传感器中的任一种或其组合。
10.如权利要求9所述的声音成分提取系统,其特征在于,所述传感装置至少包括K个,K为预先由测试获得的工作场景下所获得的对角矩阵∑(f)中对角线上元素的数量。
11.一种降噪系统,其特征在于,包括:
至少一个传感装置,分别设置于至少一个采样位置,分别用于获取一组所述声场信号并将所述声场信号输入至所述信号处理单元;
所述信号处理单元,配置为基于权利要求1或2所述的声音成分提取方法计算出声场信号中与噪音对应的所述声音成分;
降噪声音信号获取模块,配置为基于所述与噪音对应的声音成分生成用于抵消所述噪音的降噪声音信号;以及
发送模块,配置为将所述降噪声音信号发送给扬声器模块;以及
所述扬声器模块,配置为外放所述降噪声音信号。
12.一种电子设备,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1至5中任一所述的方法。
13.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至5中任一所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910125056.2A CN109874084A (zh) | 2019-02-20 | 2019-02-20 | 声音成分提取方法及系统 |
CN2019101250562 | 2019-02-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111163401A CN111163401A (zh) | 2020-05-15 |
CN111163401B true CN111163401B (zh) | 2021-09-24 |
Family
ID=66918964
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910125056.2A Pending CN109874084A (zh) | 2019-02-20 | 2019-02-20 | 声音成分提取方法及系统 |
CN202010102910.6A Active CN111163401B (zh) | 2019-02-20 | 2020-02-19 | 声音成分提取方法、降噪方法、装置及系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910125056.2A Pending CN109874084A (zh) | 2019-02-20 | 2019-02-20 | 声音成分提取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN109874084A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112509597A (zh) * | 2020-11-19 | 2021-03-16 | 珠海格力电器股份有限公司 | 录音数据识别方法和装置、录音设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1290923A (zh) * | 2000-06-29 | 2001-04-11 | 上海交通大学 | 辨识声源特性的方法 |
CN107393522A (zh) * | 2016-05-11 | 2017-11-24 | 哈曼贝克自动系统股份有限公司 | 选择车辆上主动道路噪声控制的传感器位置的方法和系统 |
CN108877758A (zh) * | 2018-07-04 | 2018-11-23 | 北京安声科技有限公司 | 一种空间场主动降噪方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8000914B2 (en) * | 2008-03-04 | 2011-08-16 | Washington State University | Systems and methods for electromechanical oscillation monitoring |
TW201507489A (zh) * | 2013-08-09 | 2015-02-16 | Nat Univ Tsing Hua | 利用陣列麥克風消除迴聲的方法 |
-
2019
- 2019-02-20 CN CN201910125056.2A patent/CN109874084A/zh active Pending
-
2020
- 2020-02-19 CN CN202010102910.6A patent/CN111163401B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1290923A (zh) * | 2000-06-29 | 2001-04-11 | 上海交通大学 | 辨识声源特性的方法 |
CN107393522A (zh) * | 2016-05-11 | 2017-11-24 | 哈曼贝克自动系统股份有限公司 | 选择车辆上主动道路噪声控制的传感器位置的方法和系统 |
CN108877758A (zh) * | 2018-07-04 | 2018-11-23 | 北京安声科技有限公司 | 一种空间场主动降噪方法 |
Non-Patent Citations (1)
Title |
---|
奇异值分解降噪的改进方法;张磊,彭伟才,原春晖,刘彦;《中国舰船研究》;20121031;第7卷(第05期);83-88 * |
Also Published As
Publication number | Publication date |
---|---|
CN111163401A (zh) | 2020-05-15 |
CN109874084A (zh) | 2019-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110148422B (zh) | 基于传声器阵列确定声源信息的方法、装置及电子设备 | |
JP6889698B2 (ja) | 音声を増幅する方法及び装置 | |
CN111261138B (zh) | 降噪系统确定方法及装置、噪声处理方法及装置 | |
US8880395B2 (en) | Source separation by independent component analysis in conjunction with source direction information | |
JP6807029B2 (ja) | 音源分離装置および方法、並びにプログラム | |
CN106233382B (zh) | 一种对若干个输入音频信号进行去混响的信号处理装置 | |
CN104318919B (zh) | 环境消噪方法、系统及移动终端 | |
Hald | Removal of incoherent noise from an averaged cross-spectral matrix | |
CN116148770B (zh) | 基于阵列信号处理的声源定位方法、装置及系统 | |
US11297430B2 (en) | Terminal device, apparatus and method for simulating the characteristic of an audio processor, and computer-readable storage medium | |
CN111163401B (zh) | 声音成分提取方法、降噪方法、装置及系统 | |
KR102194194B1 (ko) | 암묵 신호 분리를 위한 방법, 장치 및 전자 장치 | |
CN116577651A (zh) | 一种高压断路器声纹监测装置传感器位置选取方法及装置 | |
CN112951263B (zh) | 语音增强方法、装置、设备和存储介质 | |
CN112055284A (zh) | 回声消除方法及神经网络的训练方法、装置、介质、设备 | |
CN113345465B (zh) | 语音分离方法、装置、设备及计算机可读存储介质 | |
CN113593598B (zh) | 音频放大器在待机状态下的降噪方法、装置和电子设备 | |
CN107843871B (zh) | 声源定向方法、装置和电子设备 | |
CN109644304B (zh) | 混响环境的源分离 | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
CN111916100A (zh) | 回声消除方法和装置、存储介质、电子设备 | |
CN112634930B (zh) | 多通道声音增强方法、装置及电子设备 | |
Muñoz-Montoro et al. | Efficient parallel kernel based on Cholesky decomposition to accelerate multichannel nonnegative matrix factorization | |
CN112017649A (zh) | 音频处理方法、装置、电子设备及可读存储介质 | |
CN113109763B (zh) | 声源位置确定方法和装置、可读存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |