CN103544949A - 发动机声音合成 - Google Patents
发动机声音合成 Download PDFInfo
- Publication number
- CN103544949A CN103544949A CN201310289860.7A CN201310289860A CN103544949A CN 103544949 A CN103544949 A CN 103544949A CN 201310289860 A CN201310289860 A CN 201310289860A CN 103544949 A CN103544949 A CN 103544949A
- Authority
- CN
- China
- Prior art keywords
- signal
- frequency
- harmonic
- model parameter
- higher hamonic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title description 3
- 238000003786 synthesis reaction Methods 0.000 title description 3
- 238000000034 method Methods 0.000 claims abstract description 44
- 239000013598 vector Substances 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 abstract description 6
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 16
- 230000000875 corresponding effect Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 8
- 239000002360 explosive Substances 0.000 description 8
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
- G10H1/08—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by combining tones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/02—Synthesis of acoustic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/066—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/155—User input interfaces for electrophonic musical instruments
- G10H2220/211—User input interfaces for electrophonic musical instruments for microphones, i.e. control of musical parameters either directly from microphone signals or by physically associated peripherals, e.g. karaoke control switches or rhythm sensing accelerometer within the microphone casing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/215—Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
- G10H2250/235—Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/315—Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
- G10H2250/371—Gensound equipment, i.e. synthesizing sounds produced by man-made devices, e.g. machines
- G10H2250/381—Road, i.e. sounds which are part of a road, street or urban traffic soundscape, e.g. automobiles, bikes, trucks, traffic, vehicle horns, collisions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/471—General musical sound synthesis principles, i.e. sound category-independent synthesis methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本发明描述一种用于分析声音的方法。根据本发明的一个实例,所述方法包括:提供将要分析的输入声音信号且从所述输入信号或从至少一个引导信号确定所述输入信号的基频。此外,确定具有所述基频的高次谐波的频率,因此确定谐波模型参数。基于所述谐波模型参数合成谐波信号,且通过从所述输入信号减去所述谐波信号来估计残留信号。基于所述残留信号估计残留模型参数。此外,描述一种用于合成声音信号的对应方法。
Description
技术领域
各种实施方案涉及声音合成的领域,特别地涉及合成内燃发动机的声音。
背景技术
混合动力和电动汽车的日益增长的普及导致城市环境中新的安全问题,因为与(内燃)发动机噪声相关的许多听觉线索可能丢失。解决方案是智能地使车辆更嘈杂。事实上,好几个国家已经建立了要求汽车发出最小级别的声音以便向其它交通参与者警告驶来的汽车的法规。
在该领域中已进行分析且合成声音信号的一些研究(尤其在语音处理的背景中)。然而,已知方法和算法通常需要强大的数字信号处理器,其不适用于如汽车工业中所要求的低成本应用。因此,需要一种用于合成声音(尤其是内燃发动机的声音)的有效方法。
发明内容
描述一种用于分析声音的方法。根据本发明的一个实例,所述方法包括:提供将要分析的输入声音信号且从所述输入信号或从至少一个引导信号确定所述输入信号的基频。此外,确定具有所述基频的高次谐波的频率,因此确定谐波模型参数。基于所述谐波模型参数合成谐波信号,且通过从所述输入信号减去所述谐波信号来估计残留信号。基于所述残留信号估计残留模型参数。
此外,描述一种用于合成声音信号的方法。所述合成是基于可(例如)根据上文描述的分析方法确定的谐波模型参数和残留模型参数的。根据一个实例,所述方法包括:接收至少一个引导信号,且基于所述至少一个引导信号计算多个高次谐波的基频和频率。此外,提供与所计算频率相关的残留模型参数和谐波模型参数。使用用于高次谐波的所计算基频和频率的谐波模型参数来合成谐波信号。另外,使用残留模型参数合成残留信号。通过叠加合成的谐波信号与残留信号来计算总声音信号。
附图说明
参看以下附图和说明书可更好地理解本发明。图中的组件未必按比例绘制,而是将重点放在图示本发明的原理上。此外,在图中,相同标号指定对应零件。在图中:
图1是图示基于正弦曲线信号模型来分析发动机声音的一般实例的框图;
图2是图示基于如下模型来分析发动机声音的一个实例的框图,此模型利用外部引导信号来估计在输入信号中呈现的谐波正弦曲线信号内容;
图3是使用谐波正弦曲线信号内容的自适应引导式估计来分析发动机声音的另一个实例的框图;
图4是图示图3的实例中的谐波正弦曲线信号分量的适配的框图;以及
图5是图示使用信号模型的发动机声音的合成的框图,信号模型是通过根据图1到图3的实例中的一者的信号分析获得的。
具体实施方式
下面在发动机或电机声音合成的背景中描述一个或多个实施方案。然而,本文中呈现的用于分析和合成声音的方法也可应用于汽车领域外的领域,而且可应用于其它目的。如上所述,可能需要电动或混合动力汽车发出最小级别的声音来允许人(尤其是行人和听力减退的人)听到驶来的汽车。在汽车内部,内燃发动机的典型声音也可为所需的,以向司机提供关于汽车的操作状态(关于油门控制或其类似者)的声学反馈。从汽车外部能感知到的声音是由高达30km每小时到40km每小时的行驶速度的发动机声音支配的。因此,尤其在行驶速度较低的城市区域中,发动机声音是向其它交通参与者警告驶来的汽车的主要“报警信号”。
在许多应用中,所关注信号由被宽频带噪声恶化的多个正弦曲线信号分量构成。为了分析且模型化此类信号,正弦曲线或“谐波”模型是适当的。另外,主要由正弦曲线分量组成的信号能在不同应用中找到,例如,语音处理中的共振峰频率。正弦曲线模型化也可成功地应用于分析且合成由乐器产生的声音,这是因为这些乐器通常产生具有相对缓慢变化的正弦曲线分量的谐波或接近谐波信号。正弦曲线模型化提供可听到信号分量的参数表示,使得原始信号可由合成(即,通过(谐波与残留)分量的加法(即,叠加))恢复。
旋转机械系统(诸如汽车的内燃发动机)具有高谐波含量加宽频带噪声信号,且因此“正弦曲线加残留”模型良好地适用于分析且合成由真实世界内燃发动机产生的声音。出于此目的,由内燃发动机产生的声音可使用安置在汽车外部的一个或多个麦克风记录,同时汽车位于(例如)滚筒式底盘测功器中且在不同负载条件下以及在各种旋转发动机转速下操作。可分析得出的音频数据以从可稍后使用(例如,在电动汽车中)的音频数据“提取”模型参数,以通过使用适当合成器以容易方式再生电机声音。模型参数通常不是恒定的,但可尤其地取决于旋转发动机转速而变化。
图1图示用于在频域中分析音频信号以提取提到的模型参数的系统。时间离散(具有时间索引n)输入信号x[n]是如上文讨论通过测量获得的音频数据。在图1中,测量通常通过提供输入信号x[n]的输入信号源10用符号表现。信号x[n]可使用数字短时傅里叶变换(STFT)算法(例如,快速傅里叶变换(FFT)算法)变换到频域。在图1中,使用参考符号20标记执行用于产生频域中的输入信号X(ejω)的STFT的功能块。从频域中的输入信号X(ejω)开始,所有随后信号分析在频域中进行。然而,信号处理不限于频域。信号处理可部分地或甚至排外地在时域中执行。然而,当使用频域信号处理时,谐波正弦曲线的数目仅仅由所使用的FFT长度限制。
根据图1中图示的系统,将输入信号X(ejω)供应到执行正弦曲线信号分量的估计的功能块30。在本实例中,将此功能划分成两个部分,即基频f0的估计(功能块31)和具有频率f1、f2、…、fN的N个谐波正弦曲线的估计(功能块32)。在该领域中已知用于完成此任务的许多方法,且在此处不进一步详细讨论。然而,所有方法是基于可如下表达的信号模型的:
即,将输入信号x[n]模型化为以下各者的叠加:具有基频f0(对应于角频率ω0)的正弦曲线信号、具有频率f1到fN(分别对应于角频率ω1到ωN)的N个谐波正弦曲线,和宽频带非周期性残留信号r[n]。正弦曲线信号估计(区块30)的结果是包括以下各者的三个对应向量:估计的频率f=(f0,f1,…,fN),以及对应量值A=(A0,A1,…,AN),和相位值其中基频的相位可设置为零。可针对各种不同基频(例如,对应于发动机的转速900rpm、1000rpm、1100rpm等等)确定含有频率、量值和相位值的这些向量f、A、另外,可针对不同发动机负载或针对表示发动机的操作模式的其它非声学参数(齿轮数、反向齿轮激活等等)来确定向量f、A、
为了估计残留信号r[n](其也可取决于一个或多个非声学参数(齿轮数、反向齿轮激活等等)),使用估计的模型参数(即向量f、A、)以通过个别正弦曲线的叠加来合成输入信号的总(估计的)谐波含量。此通过图1中的区块40实现,且将输入信号的得出的估计的谐波部分在频域中表示为H(ejω)且在时域中表示为h[n]。可从输入信号X(ejω)减去合成的信号H(ejω)(参看区块50)以获得残留信号R(ejω),其是如上所述的时域信号r[n]的频域等效者。残留信号可经受滤波(例如,非线性平滑滤波器60)。此滤波器应被配置来平滑化残留信号,即,抑制估计的残留信号R(ejω)中的瞬态产物、尖峰脉冲或其类似者。将已滤波的残留信号R’(ejω)供应给区块70,区块70表示经执行以获得特征化残留信号的模型参数的信号分析。此信号分析可包括(例如)线性预测性编码(LPC)或简单地残留信号的功率谱的计算。举例来说,残留信号的功率谱可在不同频谱区域(根据在心理声学方面激发的频率尺度的频带,参看(例如)Fastl,Hugo;Zwicker,Eberhard;Psychoacoustics(3rd.edition),Springer,2007)中计算,其可被选择以考虑心理声学方面关键的频带限制。使用心理声学方面激发的频率尺度(诸如Bark或Mel尺度)将允许计算时间和内存使用的大量减少。
在因此已获得用于不同基频的“谐波”信号模型参数以及用于不同非声学参数(例如,发动机的转速值、齿轮数、发动机负载等等)的残留信号模型参数的情况下,可稍后使用这些模型参数来合成现实发动机声音,其对应于根据图1分析的由发动机产生的声音。
图2图示信号分析的另一个实例,其可看作是根据图1的信号分析的替代。图2的信号分析的结构对应于图1的结构,除了正弦曲线信号估计30的功能原理。图2的框图的剩余部分与图1的实例相同。在本实例中,执行引导式谐波正弦曲线估计,其中将(例如)rpm信号rpm[n]用作引导信号。在此背景中,rpm信号通常是表示发动机的转速的信号,其可(例如)通过发动机控制单元(也被称为动力传动系统控制模块,其在许多汽车中常常可通过CAN总线来访问,CAN=控制器区域网络)提供。当使用引导式正弦曲线估计时,基频不是从输入信号X(ejω)估计的,而是直接从引导信号(其在本实例中是正测试的发动机的rpm信号rpm[n])获得的。举例来说,针对六缸内燃发动机,每分钟1200转数的发动机速度得到120Hz的基频。
针对引导式正弦曲线信号估计,可使用如下信号模型。因此,将输入信号x[n]模型化为
其中n是时间索引,i表示谐波的数目,f0表示基频,且Ai和分别是第i个谐波的相位和振幅。如上所述,高次谐波的基频和频率不是从输入信号x[n]估计的,而是直接地从引导信号rpm[n]导出的。此功能性由图2中标记为“N个谐波正弦曲线的产生”的区块表示。使用在该领域中如此已知的信号处理方法来估计对应振幅Ai和相位值。举例来说,如果仅仅几个谐波将要估计,那么可使用快速傅里叶变换(FFT)算法,或者可使用戈泽尔(Goertzel)算法。常常考虑固定数目(N)个频率。在语音处理的背景中,在(例如)ChristineSmit和Daniel P.W.Ellis的GUIDED HARMONIC SINUSOIDESTIMATION IN A MULTI-PITCH ENVIRONMENT(其发表在2009年10月18号到21号的2009IEEE Workshop on Applications of SignalProcessing to Audio and Acoustics中)中描述引导式谐波估计的一个实例。
图3图示图2中呈现的实例的修改。除了信号处理区块30表示正弦曲线信号估计之外,两个框图基本上相同。引导式自适应正弦曲线估计算法将包括至少一个高次谐波的基频f0和频率(f1、f2等等)的频率向量f视作参数,且自适应性地“微调”这些频率以最优地匹配输入信号X(ejω)。因此,该估计可提供包括微调的频率f0’、f1’等等以及对应振幅向量A’=[A0’,A1’,A2’,…]和相位向量的修改的频率向量f’。尤其在引导信号(例如,rpm信号rpm[n])具有不充足品质的情况下,可使用自适应算法。机械系统(诸如汽车的动力传动系统)常常具有极高品质因数(Q-factor),且因此rpm信号rpm[n]与真实发动机速度之间的极小偏差(在几个赫兹的范围内)可使估计结果显著地降级(尤其针对高次谐波)。
图4是图示使用最小均方(LMS)最优化算法来适配包括在频率向量f中的一个频率fi(i=1,…,N)分量(以及其振幅Ai和其相位)的一个示例性程序的框图。适配的结果是由三重fi’、Ai’、表示的“微调的”正弦曲线。适配的开始点是使用如参看图2描述的基本方法估计的正弦曲线(由三重fi、Ai、表示)。即,可使用引导式谐波正弦曲线估计来获得初始值fi’、Ai’、初始值fi’、Ai’、接着使用本文中描述的自适应算法最优化,其中将频率fi(i=1,2,…,N)简单地计算为基频f0的倍数,基频f0直接由(非声学的或声学的)引导信号(例如,由汽车应用中的转速信号)导出。针对适配,将由三重fi、Ai、表示的初始正弦曲线视作相位量,将其分解成正交相分量Qi和同相分量INi(参见信号处理区块301)。这些分量Qi、INi可分别由时变加权因数a和b加权,且接着求和(复数加法,即INi+j·Qi,j是虚数单元)以获得由三重fi’、Ai’、表示的修改的(最优化的)相位量。
由LMS最优化区块302确定加权因数a、b。最优化区块302被配置来调整加权因数a、b,使得误差信号得以最小化(在最小二乘方意义上,即信号的范数得以最小化)。可将使用图3中所示的残留提取60获得的残留信号R(ejω)用作误差信号。即,适配的“目标”是最小化残留信号R(ejω)的功率且最大化谐波信号分量的总功率。实际最优化算法可以是任何适当最小化算法(尤其是LMS算法),其是基于“最大坡度(steepest gradient)”方法的。所有这些方法本身是已知的,且因此此处不详细讨论。
图1到图3中图示的信号分析可“脱机”地执行,例如使用在滚筒式底盘测功器上的测试汽车。可针对汽车发动机的各种不同rpm值来测量提到的模型参数(即,频率、振幅和相位向量f、A和以及残留模型参数)。举例来说,可针对从最小值(例如,900rpm)到最大值(例如,6000rpm)变化(间隔为例如100rpm)的离散rpm值来确定模型参数。如果针对稍后声音合成,需要针对中间rpm值(例如,2575rpm)的模型参数,那么可通过内插获得模型参数。在本实例中,可使用线性内插法从针对2500rpm和2600rpm确定的模型参数计算针对2575rpm的模型参数。
为了确定模型参数,正测试的汽车的发动机的转速可从最小rpm值连续地提升到最大rpm值。在这种情况下,针对在给定间隔(例如,从950rpm到1049rpm)内的rpm值确定的模型参数可加以平均,且与间隔的中心值(例如,在本实例中为1000rpm)相关。如果考虑其它或额外引导信号(例如,发动机负载),那么与关于将rpm信号作为引导信号描述的情况类似地执行数据采集和模型参数估计。
图5是图示利用根据图1到图3所图示的信号分析确定的模型参数的发动机声音合成的框图。在本实例中,仅使用一个引导信号(即rpm信号rpm[n])。然而,或者或另外,可使用其它引导信号。将引导信号rpm[n]供应到谐波信号发生器110且供应到模型参数数据库100。信号发生器100被配置来提供高次谐波的基频f0和频率f1、f2等等。将这些频率值(或换句话说频率向量f=[f0,f1,…,fN])供应给谐波信号合成器130。合成器130也从模型参数数据库100接收配合当前引导信号rpm[n]的谐波模型参数。模型参数数据库100也提供描述残留模型(例如,残留信号的功率谱)的模型参数。另外,模型参数数据库100可使用内插来获得如已在上文提到的正确参数。谐波信号合成器130被配置来提供对应于输入信号X(ejω)的谐波含量的谐波信号Hest(ejω),其已使用如上文关于图1到图3描述的信号分析进行估计。
将描述残留信号的模型参数提供给包络合成器140,包络合成器140恢复残留信号的量值M(ejω)。在本实例中,通过全通滤波白噪声(因此获得相位信号P(ejω))且将相位信号P(ejω)添加到量值信号M(ejω)以便产生总残留信号Rest(ejω),来恢复残留信号的相位。通过噪声发生器120产生白噪声。全通滤波器150通过以下动作实施相位滤波:将供应给滤波器输入端的白噪声映射到相位区域0到2π中,因此提供相位信号P(ejω)。通过使恢复的谐波信号Hest(ejω)与恢复的残留信号Rest(ejω)相加来获得合成的发动机声音信号Xest(ejω)。频域中的得出的声音信号可变换到时域、放大且使用常见的音频再生装置来再生。
在下文总结本发明的一些重要方面。然而,应注意,并不将如下论述视为详尽的或完备的。
本发明的一个方面涉及用于分析声音(尤其是在内燃发动机附近得到的发动机声音信号)的方法。所述方法包括确定将要分析的输入信号的基频,从而利用输入信号或至少一个引导信号。此外,确定具有所述基频的高次谐波的频率,因此获得谐波模型参数。所述方法进一步包括基于所述谐波模型参数合成谐波信号,且从所述输入信号减去所述谐波信号来获得残留信号。最后,基于所述残留信号估计残留模型参数。
所述输入信号可变换到频域,因此在进一步处理之前提供频域输入信号。在这种情况下,可考虑的高次谐波的数目仅仅限于(例如)由提供到频域的变换的FFT(快速傅里叶变换)算法使用的输入向量的长度。通常,输入信号的处理可完全在频域中执行,且因此也可在频域中计算谐波信号和残留信号。
可从至少一个引导信号导出高次谐波的基频和频率,以避免直接从输入信号估计基频(和高次谐波的频率),直接从输入信号估计基频(和高次谐波的频率)在计算上通常是复杂的。
谐波模型参数可包括高次谐波的基频和频率的频率向量、对应振幅向量和对应相位向量。确定谐波模型参数可包括估计与高次谐波的基频和频率相关的相位值和振幅值。通常,确定谐波模型参数可包括微调从至少一个引导信号获得的高次谐波的基频和频率。此微调可使高次谐波的频率和它们的对应的(估计的)振幅值和相位值的迭代修改变得必要,使得残留信号的范数(例如,L2范数)得以最小化。可将此微调视作一种最优化方法。
可使用非线性滤波器来滤波残留信号以在估计残留模型参数之前平滑化残留信号。确定残留模型参数可包括计算残留信号的功率谱。可针对根据在心理声学方面激发的频率尺度的不同频带来计算功率谱密度,以便考虑在心理声学方面关键的频带限制。
本发明的另一个方面涉及用于基于谐波模型参数和残留模型参数来合成声音信号的方法,其中参数可特别地根据上文总结的方法确定。所述方法包括基于至少一个引导信号计算多个高次谐波的基频和频率。提供与所计算频率相关的残留模型参数和谐波模型参数,且使用针对高次谐波的所计算基频和频率的谐波模型参数来合成谐波信号。此外,使用残留模型参数合成残留信号。通过叠加合成的谐波信号与残留信号来计算总声音信号。
可将已预滤波的白噪声添加到总声音信号。特别地,预滤波可包括将白噪声的振幅值映射到0到2π的相位范围中,因此产生将要添加到总声音信号的相位信号。通常,合成残留信号可包括产生具有功率谱密度的噪声信号,所述功率谱密度对应于由残留模型参数表示的功率谱密度。
尽管已揭露各种示例性实施方案,但对本领域的技术人员而言显而易见的是:可根据各种实施方案的特定实施来进行改变和修改,且不脱离本发明的精神和范围。对本领域相当熟练的技术人员而言显而易见的是:执行相同功能的其它组件可被适当地取代。特别地,信号处理功能可在时域中或在频域中执行,同时仍实现基本上相等的结果。应提到的是,参看特定图解释的特征可以与其它图(甚至在未明确地提到的图中)的特征相组合。另外,本发明的方法可在使用适当处理器指令的所有软件实施中或在利用用以实现相同结果的硬件逻辑与软件逻辑的组合的混合实施中实现。本发明概念的此类修改意欲由附加权利要求书涵盖。
Claims (15)
1.一种用于分析声音的方法,其包括:
提供输入信号;
使用所述输入信号或至少一个引导信号来确定所述输入信号的基频,且确定所述基频的高次谐波的频率,由此确定与所确定的频率相关的谐波模型参数;
基于所述谐波模型参数合成谐波信号;
通过从所述输入信号减去所述谐波信号确定残留信号;
基于所述残留信号计算残留模型参数。
2.如权利要求1所述的方法,其中所述输入信号变换到频域,由此在进一步处理之前提供频域输入信号。
3.如权利要求2所述的方法,其中所述频域输入信号的处理完全在所述频域中执行,且由此在所述频域中计算所述谐波信号和所述残留信号。
4.如权利要求1、2或3所述的方法,其中从所述至少一个引导信号导出所述高次谐波的所述基频和所述频率。
5.如权利要求4所述的方法,其中确定所述谐波模型参数包括:
微调从所述至少一个引导信号获得的所述高次谐波的所述基频和所述频率。
6.如权利要求5所述的方法,其中所述微调包括:
迭代地修改高次谐波的所确定的频率和它们的对应振幅和相位值,使得所述残留信号的范数得以最小化。
7.如权利要求4至6中任一项所述的方法,其中所述谐波模型参数包括所述高次谐波的所述基频和所述频率的频率向量、对应量值向量和对应相位向量。
8.如权利要求1至7中任一项所述的方法,其进一步包括:
在估计所述残留模型参数之前对所述残留信号进行滤波以平滑化所述残留信号。
9.如权利要求1至8中任一项所述的方法,其中确定所述残留模型参数包括
计算所述残留信号的功率谱。
10.如权利要求1至8中任一项所述的方法,其中确定谐波模型参数包括估计与高次谐波的所述基频和所述频率相关的相位值和振幅值。
11.一种用于基于特别地根据如权利要求1所述的方法确定的谐波模型参数和残留模型参数来合成声音信号的方法,所述方法包括:
接收至少一个引导信号;
基于所述至少一个引导信号计算多个高次谐波的所述基频和频率;
提供与所计算频率相关的所述残留模型参数和所述谐波模型参数;
使用用于高次谐波的所计算基频和频率的所述谐波模型参数来合成谐波信号;
使用所述残留模型参数合成残留信号;
通过叠加所述合成的谐波信号与所述残留信号来计算总声音信号。
12.如权利要求11所述的方法,其进一步包括:
将已预滤波的白噪声添加到所述总声音信号。
13.如权利要求12所述的方法,其中所述预滤波包括将所述白噪声的振幅值映射到0到2π的相位范围中,由此产生将要添加到所述总声音信号的相位信号。
14.如权利要求11至13中任一项所述的方法,其中合成所述残留信号包括:
产生具有功率谱密度的噪声信号,所述功率谱密度对应于由所述残留模型参数表示的功率谱密度。
15.如权利要求9或14所述的方法,其中在根据在心理声学方面激发的频率尺度的不同频带中计算所述功率谱密度,以便考虑在心理声学方面关键的频带限制。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12176133.2A EP2685448B1 (en) | 2012-07-12 | 2012-07-12 | Engine sound synthesis |
EP12176133.2 | 2012-07-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103544949A true CN103544949A (zh) | 2014-01-29 |
CN103544949B CN103544949B (zh) | 2018-10-09 |
Family
ID=46754265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310289860.7A Active CN103544949B (zh) | 2012-07-12 | 2013-07-11 | 发动机声音合成 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9553553B2 (zh) |
EP (1) | EP2685448B1 (zh) |
CN (1) | CN103544949B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017098307A1 (zh) * | 2015-12-10 | 2017-06-15 | 华侃如 | 基于谐波模型和声源-声道特征分解的语音分析合成方法 |
CN107408382A (zh) * | 2015-03-24 | 2017-11-28 | 伯斯有限公司 | 车辆发动机谐波声音控制 |
CN110718206A (zh) * | 2019-09-02 | 2020-01-21 | 中国第一汽车股份有限公司 | 一种主动发声系统声音目标设定方法及主动发声系统 |
CN110803103A (zh) * | 2019-08-13 | 2020-02-18 | 中国第一汽车股份有限公司 | 电动汽车主动发声系统声音控制方法及主动发声系统 |
CN110803102A (zh) * | 2019-08-13 | 2020-02-18 | 中国第一汽车股份有限公司 | 车内发动机阶次声音分析方法及电动汽车主动发声系统 |
CN111327991A (zh) * | 2018-12-13 | 2020-06-23 | 拉碧斯半导体株式会社 | 声音输出装置 |
CN111863028A (zh) * | 2020-07-20 | 2020-10-30 | 江门职业技术学院 | 一种发动机声音合成方法及系统 |
CN116206624A (zh) * | 2023-05-04 | 2023-06-02 | 科大讯飞(苏州)科技有限公司 | 一种车辆声浪合成方法、装置、存储介质及设备 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102011108956A1 (de) * | 2011-07-29 | 2013-01-31 | Audi Ag | Verfahren zur Information eines Fahrers bezüglich des Betriebszustands eines Kraftfahrzeuges und Kraftfahrzeug |
EP2991859B1 (en) * | 2013-05-01 | 2021-07-28 | Jaguar Land Rover Limited | Control system, vehicle and method |
US9495953B2 (en) | 2014-06-10 | 2016-11-15 | Bose Corporation | Dynamic engine harmonic enhancement sound stage |
US10630306B2 (en) * | 2014-09-10 | 2020-04-21 | Advantest Corporation | Method and system for spectral leakage removal in DAC testing |
KR101631872B1 (ko) * | 2014-11-21 | 2016-06-20 | 현대자동차주식회사 | 차량, 차량의 제어 방법 및 차량 주행 음 제어 장치 |
CN109524023A (zh) * | 2016-01-22 | 2019-03-26 | 大连民族大学 | 一种对基频估计实验验证的方法 |
KR101804772B1 (ko) | 2016-08-25 | 2017-12-05 | 현대자동차주식회사 | 사운드 제어장치, 차량 및 그 제어방법 |
EP3715179A3 (en) * | 2017-05-24 | 2020-12-16 | Gogoro Inc. | Systems for generating audio signals and associated methods |
US10074358B1 (en) * | 2017-09-07 | 2018-09-11 | GM Global Technology Operations LLC | Audio control systems and methods for vehicles with variable compression ratio engines |
EP3503089B1 (en) * | 2017-12-22 | 2023-10-18 | Marelli Europe S.p.A. | Apparatus for the active control of the sound of the engine of a land vehicle and corresponding method |
WO2020033595A1 (en) | 2018-08-07 | 2020-02-13 | Pangissimo, LLC | Modular speaker system |
US11011152B2 (en) | 2018-09-05 | 2021-05-18 | Harman International Industries, Incorporated | Multiple sound localizations for improved internal sound synthesis |
US11351916B2 (en) | 2018-09-27 | 2022-06-07 | Harman International Industries, Incorporated | Vehicle sound synthesis during engine start conditions |
JP7270836B2 (ja) * | 2019-08-08 | 2023-05-10 | ブームクラウド 360 インコーポレイテッド | 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク |
KR20220000655A (ko) * | 2020-06-26 | 2022-01-04 | 현대자동차주식회사 | 주행음 라이브러리, 주행음 라이브러리 생성 장치 및 주행음 라이브러리를 포함하는 차량 |
CN112298030A (zh) * | 2020-10-16 | 2021-02-02 | 中国第一汽车股份有限公司 | 一种电动汽车低速提示音装置频率响应测试系统及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5410606A (en) * | 1992-07-21 | 1995-04-25 | Honda Giken Kogyo Kabushiki Kaisha | Noise canceling method |
WO2001033543A1 (fr) * | 1999-11-02 | 2001-05-10 | Laurent Clairon | Procedes d'elaboration et d'utilisation d'une sonotheque representant les caracteristiques acoustiques de moteur de vehicule automobile, dispositifs pour mise en oeuvre |
EP1577879A1 (en) * | 2004-03-17 | 2005-09-21 | Harman Becker Automotive Systems GmbH | Active noise tuning system, use of such a noise tuning system and active noise tuning method |
CN101056107A (zh) * | 2006-04-11 | 2007-10-17 | 罗姆股份有限公司 | 滤波电路、包含其的调频发送机、以及小型电子设备 |
CN101490740A (zh) * | 2006-06-05 | 2009-07-22 | 松下电器产业株式会社 | 声音合成装置 |
CN101790887A (zh) * | 2007-08-31 | 2010-07-28 | 三星电子株式会社 | 用于对媒体信号编码/解码的方法和设备 |
US20120029923A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5999897A (en) * | 1997-11-14 | 1999-12-07 | Comsat Corporation | Method and apparatus for pitch estimation using perception based analysis by synthesis |
FR2882458A1 (fr) * | 2005-02-18 | 2006-08-25 | France Telecom | Procede de mesure de la gene due au bruit dans un signal audio |
-
2012
- 2012-07-12 EP EP12176133.2A patent/EP2685448B1/en active Active
-
2013
- 2013-07-11 CN CN201310289860.7A patent/CN103544949B/zh active Active
- 2013-07-12 US US13/940,884 patent/US9553553B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5410606A (en) * | 1992-07-21 | 1995-04-25 | Honda Giken Kogyo Kabushiki Kaisha | Noise canceling method |
WO2001033543A1 (fr) * | 1999-11-02 | 2001-05-10 | Laurent Clairon | Procedes d'elaboration et d'utilisation d'une sonotheque representant les caracteristiques acoustiques de moteur de vehicule automobile, dispositifs pour mise en oeuvre |
EP1577879A1 (en) * | 2004-03-17 | 2005-09-21 | Harman Becker Automotive Systems GmbH | Active noise tuning system, use of such a noise tuning system and active noise tuning method |
CN101056107A (zh) * | 2006-04-11 | 2007-10-17 | 罗姆股份有限公司 | 滤波电路、包含其的调频发送机、以及小型电子设备 |
CN101490740A (zh) * | 2006-06-05 | 2009-07-22 | 松下电器产业株式会社 | 声音合成装置 |
CN101790887A (zh) * | 2007-08-31 | 2010-07-28 | 三星电子株式会社 | 用于对媒体信号编码/解码的方法和设备 |
US20120029923A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
Non-Patent Citations (2)
Title |
---|
DAS D P ET AL: ""New Partitioned block filtered-x LMSalgorithm for active noise control systems"", 《FIRST INTERNATIONAL CONFERENCE ON EMERGING TRENDS IN SIGNAL PROCESSING AND VLSIDESIGN-2010》 * |
SEN M ET AL: ""Frequency-Domain Periodic Active Noise Control and Equalization"", 《IEEE TRANSACTION ON SPEECH AND AUDIO PROCESSING》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107408382A (zh) * | 2015-03-24 | 2017-11-28 | 伯斯有限公司 | 车辆发动机谐波声音控制 |
CN107408382B (zh) * | 2015-03-24 | 2021-02-05 | 伯斯有限公司 | 车辆发动机谐波声音控制 |
CN107851433A (zh) * | 2015-12-10 | 2018-03-27 | 华侃如 | 基于谐波模型和声源‑声道特征分解的语音分析合成方法 |
CN107851433B (zh) * | 2015-12-10 | 2021-06-29 | 华侃如 | 基于谐波模型和声源-声道特征分解的语音分析合成方法 |
WO2017098307A1 (zh) * | 2015-12-10 | 2017-06-15 | 华侃如 | 基于谐波模型和声源-声道特征分解的语音分析合成方法 |
US10586526B2 (en) | 2015-12-10 | 2020-03-10 | Kanru HUA | Speech analysis and synthesis method based on harmonic model and source-vocal tract decomposition |
CN111327991A (zh) * | 2018-12-13 | 2020-06-23 | 拉碧斯半导体株式会社 | 声音输出装置 |
CN110803103A (zh) * | 2019-08-13 | 2020-02-18 | 中国第一汽车股份有限公司 | 电动汽车主动发声系统声音控制方法及主动发声系统 |
CN110803102A (zh) * | 2019-08-13 | 2020-02-18 | 中国第一汽车股份有限公司 | 车内发动机阶次声音分析方法及电动汽车主动发声系统 |
CN110803103B (zh) * | 2019-08-13 | 2021-04-02 | 中国第一汽车股份有限公司 | 电动汽车主动发声系统声音控制方法及主动发声系统 |
CN110803102B (zh) * | 2019-08-13 | 2021-04-02 | 中国第一汽车股份有限公司 | 车内发动机阶次声音分析方法及电动汽车主动发声系统 |
CN110718206A (zh) * | 2019-09-02 | 2020-01-21 | 中国第一汽车股份有限公司 | 一种主动发声系统声音目标设定方法及主动发声系统 |
CN110718206B (zh) * | 2019-09-02 | 2022-02-11 | 中国第一汽车股份有限公司 | 一种主动发声系统声音目标设定方法及主动发声系统 |
CN111863028A (zh) * | 2020-07-20 | 2020-10-30 | 江门职业技术学院 | 一种发动机声音合成方法及系统 |
CN111863028B (zh) * | 2020-07-20 | 2023-05-09 | 江门职业技术学院 | 一种发动机声音合成方法及系统 |
CN116206624A (zh) * | 2023-05-04 | 2023-06-02 | 科大讯飞(苏州)科技有限公司 | 一种车辆声浪合成方法、装置、存储介质及设备 |
CN116206624B (zh) * | 2023-05-04 | 2023-08-29 | 科大讯飞(苏州)科技有限公司 | 一种车辆声浪合成方法、装置、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
US9553553B2 (en) | 2017-01-24 |
CN103544949B (zh) | 2018-10-09 |
EP2685448A1 (en) | 2014-01-15 |
US20140016792A1 (en) | 2014-01-16 |
EP2685448B1 (en) | 2018-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103544949A (zh) | 发动机声音合成 | |
US9536510B2 (en) | Sound system including an engine sound synthesizer | |
CN109229014B (zh) | 一种用于行人警示器的行人警示方法及装置 | |
CN112298031B (zh) | 一种基于换挡策略迁移的电动汽车主动发声方法及系统 | |
CN107682781A (zh) | 一种电动汽车的模拟音频发声方法 | |
CN105810203A (zh) | 消除噪声的设备和方法、声音识别设备和配备其的车辆 | |
US9050925B2 (en) | Vehicle having an electric drive | |
CN112466274B (zh) | 一种电动汽车的车内主动发声方法及系统 | |
JP6671036B2 (ja) | 騒音低減装置、移動体装置、及び、騒音低減方法 | |
CN107077839A (zh) | 用于为车辆发动机噪声主动渲染的声音合成装置 | |
CN105992101A (zh) | 用于在低噪音车辆中输出保护音的装置和方法 | |
JPH04178698A (ja) | 波形生成装置 | |
JP6570787B2 (ja) | エンジン音制御装置、エンジン音制御方法、及びエンジン音制御プログラム | |
CN112652315B (zh) | 基于深度学习的汽车引擎声实时合成系统及方法 | |
JP2011226790A (ja) | 音生成装置 | |
JP7147639B2 (ja) | 音声出力装置 | |
JP3362577B2 (ja) | 車両における車内音合成装置 | |
CN111863028A (zh) | 一种发动机声音合成方法及系统 | |
JP2018077504A (ja) | エンジン音出力装置及びエンジン音出力方法 | |
CN116992254B (zh) | 变频电机的壳振信号的重构方法、装置、设备及存储介质 | |
JPH08137490A (ja) | 波形生成装置 | |
US20230139893A1 (en) | Methods and systems for engine sound synthesis | |
CN117351927A (zh) | 一种汽车加速声的合成方法、系统及设备 | |
US20220208164A1 (en) | Systems and methods for engine harmonic cancellation | |
JP2021061462A (ja) | 振動信号生成装置および振動信号生成用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |