CN112466274A

CN112466274A - 一种电动汽车的车内主动发声方法及系统

Info

Publication number: CN112466274A
Application number: CN202011183710.4A
Authority: CN
Inventors: 蔡野锋; 叶超; 马登永; 沐永生
Original assignee: Zhongke Shangsheng Suzhou Electronics Co ltd
Current assignee: Zhongke Shangsheng Suzhou Electronics Co ltd
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2021-03-09
Anticipated expiration: 2040-10-29
Also published as: CN112466274B

Abstract

本发明公开了一种电动汽车的车内主动发声方法及系统。该车内主动发声方法包括：获取一段发动机纯加速或纯减速的声音作为音源并转换为频谱图；获取所有帧的候选频率点集合及相对应的频谱幅度；分别将所有帧的频率点按照对应同一个j值、不同i值分别连成线，将得到的线分别和对应的频谱幅度值相乘，挑选相乘结果最大的那条线作为基频线，j为某一个频率点在其所属的候选频率点集合中的下标，i为帧数；在频谱图中，根据基频线，分别获取其1,2,…,R次谐波的幅值和相位；根据电动汽车的车身参数转化相应的基频频率并查找基频频率的位置；插值获取基频频率点处所有阶次谐波的幅度和相位；合成车内主动发声信号。本发明能够模拟传统内燃机车型的车内声场环境。

Description

一种电动汽车的车内主动发声方法及系统

技术领域

本发明属于电动汽车的主动发声领域，涉及一种电动汽车的车内主动发声方法及系统。

背景技术

汽车作为人们生活中的必备交通工具，汽车内的声场环境愈来愈受重视。行业内，随着排放标准的日趋严格，无论是超跑还是普通家用轿车，其发动机排量都在逐步减少，甚至纯电动汽车可能在未来的几十年中完全取代内燃机，同时随着被动隔音技术和主动降噪控制技术的发展，车内声音将愈加安静，但同时也有越来越多的车主希望车内仍能持有象征着活力、低沉有力的内燃机声音，保持驾驶乐趣。

发明内容

本发明的目的是提供一种电动汽车的车内主动发声方法及系统，其能够模拟传统内燃机车型的车内声场环境，具有较好的驾驶乐趣。

为达到上述目的，本发明采用的技术方案为：

一种电动汽车的车内主动发声方法，包括如下步骤：

S1、获取一段音源的多个频率点处的1,2,…,R次谐波的幅值和相位，并存储为频率幅值相位参数表；

S2、根据所述电动汽车的车身参数转化相应的基频频率f；

S3、在所述频率幅值相位参数表中查找所述基频频率f的位置；

S4、根据所述基频频率f的位置，插值获取基频频率点处所有阶次谐波的幅度和相位；

S5、根据所述基频频率f、各阶次谐波的幅度和相位合成车内主动发声信号；

其中，所述步骤S1具体包括：

S11、获取一段发动机纯加速或纯减速的声音作为音源，将所述音源转换为频谱图；

S12、获取所述频谱图中的一帧数据的候选频率点集合及相对应的频谱幅度；

S13、依据获取的上一帧数据的候选频率点，挑选下一帧数据的候选频率点集合及相对应的频谱幅度；

重复步骤S13，直至获取所有帧的候选频率点集合及相对应的频谱幅度；

S14、分别将所有帧的频率点按照对应同一个j值、不同i值分别连成线，将得到的线分别和对应的频谱幅度值相乘，挑选相乘结果最大的那条线作为基频线，其中j为某一个频率点在其所属的候选频率点集合中的下标，i为帧数；

S15、在所述频谱图中，根据所述基频线，分别获取其1,2,…,R次谐波的幅值和相位。

优选地，所述步骤S12进一步包括：

S12-1、截取第一帧数据x(n)，其中n为离散时间下标，满足n＝0,…,L₁-1，L₁为第一帧数据的预设长度；

S12-2、按照式(1)求截取数据的自相关函数R(m)，其中m为自相关域中的下标，

从R(m)中在指定预设搜索区间内挑选最大的N个峰值对应的下标，其中N为预设的候选频率点数目，根据自相关域中的峰值对应的下标换算出相应的频率点，并通过离散傅里叶变换计算这些候选频率点的频谱幅度；

S12-3、按照式(2)求截取数据的SHC函数，

其中f为频率，X(f)为x(n)离散傅里叶变换，r＝1,…,H，H为预设谐波总个数，f'＝-L_f,…,L_f，L_f为预设频率范围；从SHC(f)中在指定预设搜索区间内挑选最大的N个峰值对应的频率，通过离散傅里叶变换获取这些候选频率点对应的频谱幅度；

S12-4、将第一帧数据x(n)缩短一半，在此基础上，分别根据步骤S12-2和S12-3获取相应的候选频率点以及对应的频谱幅度；

S12-5、将步骤S12-2至步骤S12-4获取的候选频率点进行合并，如果两个候选频率点之比小于预设值δ，则进行合并，新候选频率点为两频率点的平均值，频谱幅度为两频率点对应幅度的最大值；将合并完以后的候选频率点，按对应频谱幅度值从大到小进行排序，如果合并后的候选频率点个数大于2N，则去除对应频谱幅度值最小的候选频率点，直至合并后的候选频率点个数等于2N，同时为每一个频率点都配备一个计数器，初始值为预设值整数C_max。

优选地，所述步骤S13进一步包括：

S13-1、在上一帧的基础上，移动FRAME_LEN点作为当前帧的开始位置，其中FRAME_LEN为预设参数值，并根据上一帧的候选频率点确定当前帧的长度L_i＝α*T_max，其中i为当前帧下标，T_max为上一帧候选频率点最小频率点对应的周期长度，α为预设倍数；

S13-2、获取当前帧的频率点集合F_c以及相对应的频谱幅度。

S13-3、依次根据上一帧的候选频率点集合F_i-1中的频率，在F_c中挑选最接近的点，满足频率点之比小于预设值δ，作为当前帧候选频率点集合F_i；

S13-4、如果在F_c中不存在与F_i-1中某个频率点f_i-1,j对应的频率点，其中j为在集合中的下标；则在f_i-1,j的预设附近区间内对SHC值进行搜索，挑选SHC最大值对应的频率点作为新的频率点f_i,j，并记录相对应的频谱幅度，同时将其对应的计数器值减1；

S13-5、检查各个候选频率对应的计数器，如有计数器对应的值为0，则替换此频率，替换完频率以后，将对应的计数器值重置为预设初始值C_max；

S13-6、获取当前帧的候选频率点集合F_i、对应的频谱幅度以及对应的计数器值。

更优选地，所述步骤S13-5中，替换规则为：如果F_c中频谱幅度最大的频率点没在步骤S13-3和步骤S13-4中选中，则挑选此频率点；如果上述条件不满足，则在F_c中选择与当前频率最接近的频率点。

优选地，所述步骤S11中，通过短时傅里叶变换将所述音源转换为频谱图。

优选地，所述步骤S2中，将电动汽车的车身参数输入预先训练好的GRU-RNN模型中，预测出转数和声压级，通过转速获得相应的基频频率f。

优选地，所述步骤S5中，还根据步骤S2获得的声压级调整各阶次谐波的权重系数。

本发明还采用如下技术方案：

一种电动汽车的车内主动发声系统，包括：

车身参数获取模块，其用于获取电动汽车的车身参数；

信号处理芯片，其用于执行如上所述的车内主动发声方法；

扬声器，其用于根据所述主动发声音源合成模块生成的主动发声信号播放声音。

优选地，所述信号处理芯片包括主动发声音源合成模块，所述主动发声音源合成模块包括：

频率相位参数模块，其用于接收一段纯加速或纯减速的音源，并分析得到多个频率点处的1,2,…,R次谐波的幅值和相位，存储为频率幅值相位参数表；

插值模块，其用于根据所述车身参数对应基频频率f查找其在频率幅值相位参数表中的位置，通过插值算法获得基频频率点处所有阶次谐波的幅度和相位；及

合成模块，其根据所述基频频率f、各阶次谐波的幅度和相位合成车内主动发声信号。

优选地，所述信号处理芯片还包括用于根据所述车身参数预测出转数和声压级的预测模型，所述插值模块用于根据所述转数对应的所述基频频率f查找其在频率幅值相位参数表中的位置，所述合成模块还用于根据所述声压级调整各阶次谐波的权重系数。

本发明采用以上方案，相比现有技术具有如下优点：

本发明的电动汽车的车内主动发声方法及系统中，可以保持传统内燃机汽车品牌声音DNA的传承。尽管主动发声音源可以完全重新设计，但因为主观性和个化性较强，要想获得用户认可较难。而现有部分传承较久的车型的内燃机声音已获大众认可，而使用本发明的方法和系统可以保持原始声音特色，车内仍能持有象征着活力、低沉有力的内燃机声音，保持驾驶乐趣。只需要一段连续加速和连续减速作为分析音源，因为连续加速或减速的音源里包含了所有的转速信息，可以避免录制花费大量的时间和人力。网上存在很多不同车型的加速或减速音源，本发明的方法和系统中，不需要通过获取转数信号，也可以较好的估计出相应的基频，进一步可以获取相应音源参数，从而避免了重新录制音源，节省了大量的时间和人力。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本发明的一种实施例采用的GRU-RNN模型的示意图；

图2为图1所示GRU-RNN模型的GRU结构的示意图；

图3为短时傅里叶变换频谱图；

图4为追踪到的多线频率；

图5为根据本发明的一种实施例的电动汽车主动发声系统的框图。

其中：

1、车身参数获取模块；2、预测模型；3、主动发声音源合成模块；31、频率相位参数模块；32、插值模块；33、合成模块；4、声场控制模块；5、驱动功放；6、扬声器。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域的技术人员理解。在此需要说明的是，对于这些实施方式的说明用于帮助理解本发明，但并不构成对本发明的限定。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以互相结合。

训练GRU-RNN模型

1.选定对标传统内燃机车型。

2.通过CAN总线采集在各种工况下的车身数据：车速、油门、扭矩、档位和转数，以及通过声学测量设备记录对应的车内驾驶员耳朵处的声压级。

3.将车速数据依据车辆设计的最大车速数进行归一化，油门数据按照最大油门数进行归一化、扭矩数据按照最大扭矩数据进行归一化，档位数据只记录P档、N档、R档和D档(D档若再细分，统一按D档处理)，并赋于P档为0，N档为1，R档为2，D档为3，转数数据按照最大转数数据时行归一化，声压级数据(单位为dB)按照最大声压级进行归一化。

4.将车速、油门、扭矩、档位作为输入信号，外加一个模式作为输入信号，模式信号的意义在于，如果存在多种对标车型，可以共用一套参数，因此模式编码代表不同的车型，用非负整数来代表不同的车型，如果只有一个对标车型，则模式输入值恒为0。将转数和声压级作为输出信号。将采集的数据送入预测模型通过BP算法进行训练，直至收敛。模式是用于区分模拟不同的车型换档策略或者同一辆车不同风格的换档策略，在电动车主动发声系统中，是用户需要设定的参数。

具体而言，预测模型为基于GRU结构的RNN模型(GRU-RNN模型)。在实际上观察发现，换档策略不仅当前输入参数有关系，也同时跟上一时间状态有关系，因此采用该GRU-RNN模型匹配这一非线性过程。

如图1所示，RNN输入层单元个数为5，分别和车速、油门、扭矩、档位以及模式对应。隐藏层为三层，每层单元个数为N，N为预设值，隐藏层的激活函数为relu函数。输出层单元个数为2，对应转数和声压级，输出层激活函数为sigmoid。上述激活函数relu和sigmoid的数学表达式分别为：y＝max(0，x)、y＝1/(1+e^-x)。

GRU结构如图2所示。其中：

z_t＝sigmoid(W_z·[h_t-1，x_t])

rt＝sigmoid(W_r·[h_t-1，x_t])

式中，W_z和W_r是相应的权重函数，x_t是隐藏层输入，h_t是隐藏层输出，h_t-1是上一个时间的隐藏层输出。

通过GRU-RNN模型预测

在新能源电动汽车上，通过CAN采集车速、油门、扭矩、档位等车身参数，并将其归一化，并将归一化的数据送入上述训练完的预测模型(即GRU-RNN模型)，通过网络模型预测相应的归一化转数和声压级，根据归一化转数，获合成相应的主动发声音源(比如正弦波合成或者波形拼接等方法)，根据声压级调整合成音源幅度，通过车内扬声器播放。

电动汽车主动发声方法

本实施例还提供一种具体的电动汽车主动发声方法，包括如下步骤：

S1、通过下述的多尺度多线基频分析算法预先获取一段音源的多个频率点处的1，2，…，R次谐波的幅值和相位，并存储为频率幅值相位参数表；

S2、获取电动汽车的车身参数并根据车身参数转化相应的基频频率f；

S3、在所述频率幅值相位参数表中查找所述基频频率f的位置(例如f_n＜f＜f_n+1)；

S4、根据所述基频频率f的位置，插值获取基频频率点处所有阶次谐波的幅度A_k和相位φ_k；

S5、合成相应的发动机信号

上式中，K为有效谐波阶次，k＝1…K，t为时间。

步骤S1具体如下：

S11、获取一段纯加速或纯减速的音源，音源可以通过网上下载或者重新录制获取，图3示出了本实施例中选用的音源的短时傅里叶变换频谱图。

S12、初始化阶段(第一帧)：

S12.0、截取第一帧数据x(n)，其中n为离散时间下标，满足n＝0,…,L₁-1，L₁第一帧数据的预设长度；

S12.1、求截取数据的自相关函数R(m)，其中m为自相关域中的下标

从R(m)中在指定预设搜索区间内挑选最大的N个峰值对应的下标(如不存在N个峰值，则挑选实际峰值对应的下标，如一个峰值都不存在，则挑选最大值对应的下标)，其中N为预设的候选频率点数目，根据自相关域中的峰值对应的下标换算出相应的频率点，并通过离散傅里叶变换计算这些候选频率点的频谱幅度。

S12.2、求截取数据的SHC(Spectral Harmonics Correlation)函数

其中f为频率，X(f)为x(n)离散傅里叶变换，r＝1,…,H是谐波个数下标，H为预设谐波总个数，f'＝-L_f,…,L_f为频率范围下标，L_f为预设频率范围。从SHC(f)中在指定预设搜索区间内挑选最大的N个峰值对应的频率(如不存在N个峰值，则挑选实际峰值对应的频率，如一个峰值都不存在，则挑选最大值对应的频率)，同时通过离散傅里叶变换获取这些候选频率点对应的频谱幅度。

S12.3、将第一帧数据x(n)缩短一半，在此基础上，分别根据步骤S12.1和S12.2获取相应的候选频率点以及对应的频谱幅度。在转数变化较快区间，由于长度过长，可能会导致某些基频频率点被淹没，通过缩短长度，在不同时间尺度上，可以获取这些基频频率点。

S12.4、将步骤S12.1-12.3获取的候选频率点进行合并，如果两个候选频率点之比小于预设值δ，则进行合并，新候选频率点为两频率点的平均值，频谱幅度为两频率点对应幅度的最大值。将合并完以后的候选频率点，按对应频谱幅度值从大到小进行排序，如果合并后的候选频率点个数大于2N，则去除对应频谱幅度值最小的候选频率点，直至合并后的候选频率点个数等于2N，同时为每一个频率点都配备一个计数器，初始值为预设值整数C_max

S13、追踪阶段：

S13.1、在上一帧的基础上，移动FRAME_LEN点作为当前帧的开始位置，其中FRAME_LEN为预设参数值，并根据上一帧的候选频率点确定当前帧的长度L_i＝α*T_max，其中i为当前帧下标，T_max为上一帧候选频率点最小频率点对应的周期长度，α为预设倍数。

S13.2、按照步骤S12.1-12.4获取频率点集合F_c以及相对应的频谱幅度。

S13.3.依次根据上一帧的候选频率点集合F_i-1中的频率，在F_c中挑选最接近的点，满足频率点之比小于预设值δ，作为当前帧候选频率点集合F_i。

S13.4.按照S13.3操作，如果在F_c中不存在与F_i-1中某个频率点f_i-1,j对应的频率点，其中j为在集合中的下标。则在f_i-1,j的预设附近区间内对SHC值进行搜索，挑选SHC最大值对应的频率点作为新的频率点f_i,j，并记录相对应的频谱幅度，同时将其对应的计数器值减1。

有时候在某此转数下，基频值不一定突出或消失，因此不能立刻判断为此基频值消失。

S13.5、在S13.4的基础上，检查各个候选频率对应的计数器，如有计数器对应的值为0，则替换此频率，替换规则为：A、如果F_c中频谱幅度最大的频率点没在步骤S13.3-13.4中选中，则挑选此频率点；B、如果A条件不满足，则在F_c中选择与当前频率最接近的频率点。替换完频率以后，将对应的计数器值重置为预设初始值C_max。

S13.6、根据上述步骤获取当前帧的候选频率点集合F_i、对应的频谱幅度以及对应的计数器值。

S14、计算完所有帧的候选频率点以后，将f_i,j对应同一个j值、不同i值连成一条线，将这条线对应频谱幅度值进行相乘，挑选相乘结果最大的那条线作为最终获取的基频线，如图4所示。

因为可能会搜索到多条连续的线，基频线可能在某些局部区域不占优势，但在整体区域会点优势，因此通过全局的方式去挑选结果会更可靠。

S15、在短时傅里叶变换谱中，根据候选频率点线，分别获取其1,2,…,R次谐波的幅值和相位。

步骤S2中，具体将采集到的电动汽车的油门、车速、踏板等车身参数进行归一化后，输入上述预先训练好的GRU-RNN模型中，预测出转数和声压级，通过转速获得相应的基频频率f。

步骤S5中，还根据步骤S2获得的声压级调整各阶次谐波的权重系数，以获得预期的总谐波的幅值和相位。

电动汽车主动发声系统

本实施例还提供一种具体的电动汽车主动发声系统。如图5所示，该电动汽车的主动发声系统包括：车身参数获取模块1、预测模型2、主动发声音源合成模块3、声场控制模块4、驱动功放5及车内扬声器6。其中，预测模型2、主动发声音源合成模块3和声场控制模块4均设置于一信号处理芯片上。

车身参数获取模块1用于获取电动汽车的车身参数。本实施例中具体采用与电动汽车通信的CAN总线。车身参数具体为车速、油门、扭矩、和档位。

预测模型2用于根据车身参数预测出转数和声压级。本实施例中具体采用上文述及的训练方法预先训练好的GRU-RNN模型，将归一化处理后的车速、油门、扭矩、和档位输入训练好的GRU-RNN模型中，预测并输出转数和声压级。

主动发声音源合成模块3用于根据转数合成相应的主动发声音源，根据声压级调整主动发声音源的幅度。具体而言，主动发声音源合成模块3包括频率相位参数模块31、插值模块32和合成模块33。频率相位参数模块31接收一段纯加速或纯减速的音源，并根据上文述及的多尺度多线基频分析算法分析得到多个频率点处的1,2,…,R次谐波的幅值和相位，并存储为频率幅值相位参数表。插值模块32的一个输入端和频率相位参数模块31的输出端电性连接以获取频率幅值相位参数表，插值模块32的另一个输入端和预测模型2的输出端电性连接以获取预测出的转数和声压级，并根据转速对应的基频频率查找其在频率幅值相位参数表中的位置，通过插值算法获得基频频率点处所有阶次谐波的幅度和相位。合成模块33的输入端和插值模块32的输出端电性连接，用于获取基频频率点处所有阶次谐波的幅度和相位，根据公式

合成相应的发动机信号，并根据声压级调整各阶次谐波的权重系数，以获得预期的总谐波的幅值和相位，输出主动发声音源信号。

声场控制模块4的输入端和合成模块33的输出端电性连接，用于通过声场控制调试技术调试车内声场。

驱动功放5的输入端和声场控制模块4的输出端电性连接，以将合成的主动发声音源信号转换为模拟信号，馈给车内的扬声器6进行播放。当车内的扬声器6为数字扬声器6时，则扬声器6的输入端直接和合成模块电性连接，而不需要驱动功放5。

本实施例的电动汽车主动发声方法及系统可以保持传统内燃机汽车品牌声音DNA的传承。尽管主动发声音源可以完全重新设计，但因为主观性和个化性较强，要想获得用户认可较难。而现有部分传承较久的车型的内燃机声音已获大众认可，而使用本方法可以保持原始声音特色，更易打入市场。只需要一段连续加速和连续减速的音源，因为连续加速或减速的音源里包含了所有的转速信息，可以避免录制花费大量的时间和人力。网上存在很多不同内燃机车型的加速或减速音源，通过我们的高精度分析算法，不需要通过CAN获取转数信号，也可以较好地估计出相应的基频，进一步可以获取相应音源参数，从而避免了重新录制音源，节省了大量的时间和人力。

此外，采用基于GRU结构的RNN深度学习网络，根据车身参数可以更好的模拟出当前转数，因为深度学习网络有高度非线性，可以直接从数据中学出相应的换档策略，不需要人为去建立近似模型，降低了工作难度。且将换档策略与声音风格解耦合，分别独立设计，分工明确，这样可以在同一辆电动汽车上可以同时拥有传统内燃机车型A的声音风格和传统内燃机车型B的换档策略

上述实施例只为说明本发明的技术构思及特点，是一种优选的实施例，其目的在于熟悉此项技术的人士能够了解本发明的内容并据以实施，并不能以此限定本发明的保护范围。凡根据本发明的精神实质所作的等效变换或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种电动汽车的车内主动发声方法，其特征在于，包括如下步骤：

S2、根据所述电动汽车的车身参数转化相应的基频频率f；

S4、根据所述基频频率f的位置，插值获取基频频率点处所有阶次谐波的幅值和相位；

其中，所述步骤S1具体包括：

2.根据权利要求1所述的车内主动发声方法，其特征在于，所述步骤S12进一步包括：

S12-3、按照式(2)求截取数据的SHC函数，

3.根据权利要求1所述的车内主动发声方法，其特征在于，所述步骤S13进一步包括：

S13-2、获取当前帧的频率点集合F_c以及相对应的频谱幅度。

4.根据权利要求3所述的车内主动发声方法，其特征在于，所述步骤S13-5中，替换规则为：如果F_c中频谱幅度最大的频率点没在步骤S13-3和步骤S13-4中选中，则挑选此频率点；如果上述条件不满足，则在F_c中选择与当前频率最接近的频率点。

5.根据权利要求1所述的车内主动发声方法，其特征在于，所述步骤S11中，通过短时傅里叶变换将所述音源转换为频谱图。

6.根据权利要求1所述的车内主动发声方法，其特征在于，所述步骤S2中，将电动汽车的车身参数输入预先训练好的GRU-RNN模型中，预测出转数和声压级，通过转速获得相应的基频频率f。

7.根据权利要求6所述的车内主动发声方法，其特征在于：所述步骤S5中，还根据步骤S2获得的声压级调整各阶次谐波的权重系数。

8.一种电动汽车的车内主动发声系统，其特征在于，包括：

车身参数获取模块，其用于获取电动汽车的车身参数；

信号处理芯片，其用于执行如权利要求1至7任一项所述的车内主动发声方法；

9.根据权利要求7所述的车内主动发声系统，其特征在于，所述信号处理芯片包括主动发声音源合成模块，所述主动发声音源合成模块包括：

10.根据权利要求9所述的车内主动发声系统，其特征在于，所述信号处理芯片还包括用于根据所述车身参数预测出转数和声压级的预测模型，所述插值模块用于根据所述转数对应的所述基频频率f查找其在频率幅值相位参数表中的位置，所述合成模块还用于根据所述声压级调整各阶次谐波的权重系数。