CN116564346A - 模型训练及声音品质评价方法、装置、电子设备 - Google Patents
模型训练及声音品质评价方法、装置、电子设备 Download PDFInfo
- Publication number
- CN116564346A CN116564346A CN202310501432.XA CN202310501432A CN116564346A CN 116564346 A CN116564346 A CN 116564346A CN 202310501432 A CN202310501432 A CN 202310501432A CN 116564346 A CN116564346 A CN 116564346A
- Authority
- CN
- China
- Prior art keywords
- model
- training
- training sample
- sound quality
- parameter values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 143
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 21
- 238000003860 storage Methods 0.000 claims abstract description 21
- 238000003062 neural network model Methods 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 10
- 238000005303 weighing Methods 0.000 claims description 5
- 238000010219 correlation analysis Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 4
- 239000003921 oil Substances 0.000 description 4
- 238000012827 research and development Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 239000000295 fuel oil Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000010220 Pearson correlation analysis Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种模型训练及声音品质评价方法、装置、电子设备和存储介质。其中,模型训练方法包括:获取训练样本集;训练样本集中的训练样本为驻车充电工况下的车内声音数据;获取每个训练样本对应的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型;设定模型为径向基神经网络模型,设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种模型训练及声音品质评价方法、装置、电子设备和存储介质。
背景技术
随着人们生活品质的不断提升,各种车况下的声音品质好坏逐渐纳入客户买车需求指标。在汽车研发过程中,研发人员更多的倾向于研究怠速噪声、加速噪声、关门声等与燃油车一致的常用工况,但新能源汽车还存在一种特殊工况:驻车充电工况。相关技术采用人工主观评价的方式来评估驻车充电工况下的声音品质,但是人工主观评价过于耗时繁琐,工作量大。
发明内容
有鉴于此,本发明实施例提供了一种模型训练及声音品质评价方法、装置、电子设备和存储介质,旨在提高预测模型的预测准确率。
本发明实施例的技术方案是这样实现的:
一方面,本发明实施例提供了一种模型训练方法,该方法包括:
获取训练样本集;所述训练样本集中的训练样本为驻车充电工况下的车内声音数据;
获取每个训练样本对应的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型;所述设定模型为径向基神经网络模型,所述设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。
在上述方案中,所述获取每个训练样本对应的多个设定参数的参数值之后,所述方法还包括:
对所述多个设定参数的参数值和主观评分进行相关性分析,得到每个设定参数与主观评分的相关系数;
对应地,所述基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型,包括:
基于所述多个设定参数中相关系数大于第一阈值的设定参数的参数值,以及每个训练样本的主观评分,训练所述设定模型。
在上述方案中,所述方法还包括:
获取多个评价人员输入的对每个训练样本的主观评分。
在上述方案中,所述方法还包括:
基于验证样本集确定所述设定模型的预测误差;
在所述预测误差小于第二阈值的情况下,确定所述设定模型训练完成。
在上述方案中,所述多个设定参数包括以下至少两项:
线性声压级;
A计权声压级;
响度;
声强级SIL;
粗糙度;
尖锐度;
波动强度;
共轨油压。
另一方面,本发明实施例提供了一种声音品质评价方法,该方法包括:
采集驻车充电工况下的车内声音数据;
获取所述车内声音数据的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
将所述多个第一参数的参数值输入设定模型,得到所述设定模型预测的对所述车内声音数据的声音品质评分;所述设定模型为径向基神经网络模型。
在上述方案中,所述采集驻车充电工况下的车内声音数据,包括:
采集主驾驶位和/或副驾驶位的左右耳位置点的声音数据。
另一方面,本发明实施例提供了一种模型训练装置,该装置包括:
第一获取模块,用于获取训练样本集;所述训练样本集中的训练样本为驻车充电工况下的车内声音数据;
第二获取模块,用于获取每个训练样本对应的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
训练模块,用于基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型;所述设定模型为径向基神经网络模型,所述设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。
一方面,本发明实施例提供了一种声音品质评价装置,该装置包括:
采集模块,用于采集驻车充电工况下的车内声音数据;
第三获取模块,用于获取所述车内声音数据的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
预测模块,用于将所述多个第一参数的参数值输入设定模型,得到所述设定模型预测的对所述车内声音数据的声音品质评分;所述设定模型为径向基神经网络模型。
另一方面,本发明实施例提供了一种电子设备,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行本发明实施例第一方面提供的模型训练方法的步骤或第二方面提供的声音品质评价方法的步骤。
另一方面,本发明实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序。所述计算机程序被处理器执行时实现如本发明实施例第一方面提供的模型训练方法的步骤或第二方面提供的声音品质评价方法的步骤。
本发明实施例通过获取训练样本集,获取训练样本集中的每个训练样本对应的多个设定参数的参数值,基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型。其中,训练样本集中的训练样本为驻车充电工况下的车内声音数据,每个设定参数表征一种反映声音品质的客观参数,设定模型为径向基神经网络模型,设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。本实施例通过径向基神经网络来训练设定模型,可以提高设定模型的预测精确度。通过设定模型预测驻车充电工况下的声音品质评分,能够实现声品质的自动化评价,避免组织评价团来进行主观评价,提高了声品质评价效率,同时预测评分的准确率高,对后续驻车充电声品质优化有着较强的指导意义。
附图说明
图1是本发明实施例提供的一种模型训练方法的实现流程示意图;
图2是本发明实施例提供的一种主观评价标准的示意图;
图3是本发明实施例提供的一种径向基网络结构模型的示意图;
图4是本发明实施例提供的一种主观评价实际值与主观评价预测值的误差示意图;
图5是本发明实施例提供的一种声音品质评价方法的实现流程示意图;
图6是本发明实施例提供的一种模型训练装置的示意图;
图7是本发明实施例提供的一种声音品质评价装置的示意图;
图8是本发明实施例提供的电子设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着人们生活品质的不断提升,汽车声品质好坏逐渐纳入客户买车需求指标,客户不仅关心汽车声音大小,还关心汽车各种工况下的声音质量的好坏。在传统燃油车研发过程中,大家一般只关心声压级大小,用dB(A)表示,单纯认为声压级在目标值以下越低越好,但声压级大小并不能完全代表客户的主观感受,相反有些车虽然声压级比较高,但客户觉得这类车比较有动力感。
同时,在噪声、振动与声振粗糙度(NVH,Noise、Vibration、Harshness)研发过程中,研发人员更多的倾向于研究怠速噪声、加速噪声、关门声等与燃油车一致的常用工况,但新能源汽车还存在一种特殊工况—驻车充电工况,这也是驾驶员常见的工况,这种工况下人们对噪声声品质更加注重。
目前,在发动机转速上升且带有载荷扭矩的情况下,各种驻车充电的咚咚音或者其他怠速噪声未凸显出来的异响更容易被乘客所感知,所以相关技术通常是研究燃油车与新能源车共有工况的声品质,没有涉及驻车充电工况。
对于各种工况的声品质,相关技术采用人工主观评价的方式来评估驻车充电工况下的声音品质,但是人工主观评价过于耗时繁琐,工作量大。
针对上述相关技术的缺点,本发明实施例提供了一种模型训练方法和声音品质评价方法方法,能够精准预测汽车驻车充电工况下的声音品质,克服了声品质主观评价过于耗时繁琐和工作量大的困难。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1是本发明实施例提供的一种模型训练方法的实现流程示意图,所述模型训练方法的执行主体为电子设备,电子设备包括台式电脑、笔记本电脑和服务器等。其中,所述服务器可以是实体的设备,也可以是部署在云端的虚拟化设备。参考图1,模型训练方法包括:
S101,获取训练样本集;所述训练样本集中的训练样本为驻车充电工况下的车内声音数据。
预先采集汽车驻车充电工况下的车内声音数据作为训练样本,例如,采集100个车内声音数据,将其中80个作为训练样本集,另外20个作为验证样本集,用来验证模型的训练效果。
在实际应用中,可以选取5台同级别的混动汽车作为竞品车,利用四个传声器采集主驾驶员左右及副驾驶员左右耳四个布点的声音数据,根据声学测量标准ISO-3744、IS0-3745,采集不同剩余电量(SOC,StateOfCharge)工况下驻车充电的数据,后期截取其中5s稳定工况作为训练样本。SOC就是指电池的荷电状态,通常指电池的剩余电量,当前剩余电量在相同的放电条件下与电池的这个额定容量的比值,也称之为这个电池的剩余电量。
S102,获取每个训练样本对应的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数。
设定参数是反映声音品质的客观参数,在一实施例中,所述多个设定参数包括以下至少两项:
线性声压级;
A计权声压级;
响度;
声强级SIL;
粗糙度;
尖锐度;
波动强度;
共轨油压。
S103,基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型;所述设定模型为径向基神经网络模型,所述设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。
在一实施例中,所述方法还包括:
获取多个评价人员输入的对每个训练样本的主观评分。
每个训练样本都有对应的主观评分,主观评分是由评价人员对训练样本进行主观评价得到的。例如,选取30名主机厂研发人员对100个训练样本进行主观评价打分,男女性别比例为1:1,年龄段在24至40岁之间,评价人员专业方向含设计、仿真、项目管理、NVH、商务等,对训练样本进行主观评价得到主观评分,可以用到等级评分法,如图2所示,图2是本发明实施例提供的一种主观评价标准的示意图,每个训练样本的主观评分为所有评测人员的主观评价结果的算术平均值。
设定模型为径向基神经网络(RBF,RadialBasisFunctionNeuralNetwork)模型,径向基神经网络模型由输入层、隐含层和输出层构成,第一层为输入层,由信号源节点构成,仅起到数据信息的传递作用,对输入信息不做任何变换,输入信息为多个设定参数的参数值;第二层为隐含层,隐含层神经元核函数(作用函数)是高斯函数,对输入信息进行空间映射的变换,隐藏层节点数视所描述问题的需要而定。第三层为输出层,是对输入模式做出的响应。输出层神经元的作用函数为线性函数,对隐含层神经元输出的信息进行线性加权后输出,作为整个神经网络的输出结果。
输入层仅仅起到传输信号作用,输入层和隐含层之间可以看做连接权值为1的连接,输出层与隐含层所完成的任务是不同的,因而他们的学习策略也不同。输出层是对线性权进行调整,采用的是线性优化策略;而隐含层是对激活函数(高斯函数)的参数进行调整,采用的是非线性优化策略。
RBF神经网络的基本思想:用RBF作为隐单元的“基”构成隐藏层空间,隐藏层对输入矢量进行变换,将低维的模式输入数据变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分。详细一点就是用RBF的隐单元的“基”构成隐藏层空间,这样就可以将输入矢量直接映射到隐空间。当RBF的中心点确定以后,这种映射关系也就确定了。而隐含层空间到输出空间的映射是线性的(注意这个地方区分一下线性映射和非线性映射的关系),即网络输出是因单元输出的线性加权和,此处的权即为网络可调参数。
如图3所示,图3是本发明实施例提供的一种径向基网络结构模型的示意图。其中,x1、x2、x3...是输入层的输入信息,例如,x1表示响度,x2表示尖锐度,x3表示粗糙度,x4表示AI指数。h1、h2、h3...为隐含层的神经元核函数(高斯函数)。w1、w2、w3...为网络的输出连接权值。Σ为输出层输出的声品质,输出层的输出可以为图2中的等级1至10,等级1至10代表了不同的声品质。
本实施例使用K均值聚类算法来优化径向基RBF神经网络,K均值聚类算法是判断基于数据到中心点的距离来区分数据的所属类别。其把N个对象划分成k个簇,用簇中对象的均值表示每个簇的中心点,利用合适的距离计算公式,计算出数据与聚类中心的距离,将其划分到合适的聚类中。当所有数据聚类结束后,检查聚类中心是否已收敛,如果收敛则终止,否则将继续迭代。
通过训练样本对应的多个设定参数的参数值,以及训练样本的主观评分,训练设定模型,训练设定模型的过程就是确定输入层与隐含层间的权值,以及确定隐含层与输出层间的权值。
本实施例不具体限定预测模型的训练方法,实际应用中所使用的模型训练方法可以根据实际情况进行选择,既可以采用专家经验模型或统计特征之类的传统方法,也可以采用监督学习、无监督学习或半监督学习之类的机器学习方法。
例如,可以采用机器学习中的监督学习算法训练设定模型。机器学习主要用于解决分类、回归和聚类问题,分类属于监督学习算法,是指根据已有的数据和标签(分类的类别)进行学习,预测未知数据的标签。分类问题的目标是预测数据的类别标签,在本实施例中,类别标签就是车内声音数据的声品质评分。
通过训练设定模型,可以得到设定参数的参数值与声品质评分的对应关系,当设定模型训练完成后,设定模型可以基于该对应关系来预测车内声音数据的声品质评分。将车内声音数据的多个设定参数的参数值输入设定模型,设定模型输出该车内声音数据的声音品质评分。
本发明实施例通过获取训练样本集,获取训练样本集中的每个训练样本对应的多个设定参数的参数值,基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型。其中,训练样本集中的训练样本为驻车充电工况下的车内声音数据,每个设定参数表征一种反映声音品质的客观参数,设定模型为径向基神经网络模型,设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。本实施例通过径向基神经网络来训练设定模型,可以提高设定模型的预测精确度。通过设定模型预测驻车充电工况下的声音品质评分,能够实现声品质的自动化评价,避免组织评价团来进行主观评价,提高了声品质评价效率,同时预测评分的准确率高,对后续驻车充电声品质优化有着较强的指导意义。
在一实施例中,所述获取每个训练样本对应的多个设定参数的参数值之后,所述方法还包括:
对所述多个设定参数的参数值和主观评分进行相关性分析,得到每个设定参数与主观评分的相关系数;
对应地,所述基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型,包括:
基于所述多个设定参数中相关系数大于第一阈值的设定参数的参数值,以及每个训练样本的主观评分,训练所述设定模型。
这里,可以使用Pearson(皮尔逊相关系数)相关性分析,相关系数对应指Pearson相关系数,又称积差相关系数,是表达两变量线性相关程度及方向的统计指标。两个变量之间的Pearson相关系数定义为两个变量之间的协方差和标准差的商。
根据Pearson相关系数的计算公式,可以计算出每个设定参数与主观评分的相关系数,Pearson相关系数的取值范围为(-1,1),相关系数小于0为负相关,大于0为正相关,等于0表示不存在相关。相关系数的绝对值越大,表示两变量间的相关程度越密切。
本实施例中,利用多个设定参数中相关系数大于第一阈值的设定参数的参数值,以及每个训练样本的主观评分,训练所述设定模型。这样训练出的模型精确度更高。例如,第一阈值为0.4。应理解,这里提到的相关系数大于第一阈值,是指相关系数的绝对值。
在另一实施例中,使用PCA主成分分析训练样本的主要影响参数,利用主要影响参数的参数值来训练设定模型。主成分分析(PrincipalComponent Analysis,PCA)是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
本实施例对设定参数进行精选,排除相关性过小的设定参数,剩余的设定参数用来训练设定模型,可以增加设定模型的预测精确度。
在一实施例中,所述方法还包括:
基于验证样本集确定所述设定模型的预测误差;
在所述预测误差小于第二阈值的情况下,确定所述设定模型训练完成。
验证样本集用于验证模型的训练效果,验证样本集中的样本同样有对应的主观评分,获取验证样本集中的样本的多个设定参数的参数值,将验证样本集中的样本的多个设定参数的参数值输入设定模型,得到模型的预测结果。将预测结果与样本的主观评分进行对比,计算预测误差,若误差小于第二阈值,则确定设定模型训练完成。如果误差大于或等于第二阈值,则需要继续训练设定模型。例如,第二阈值可以为5%。
预测误差越小,说明设定模型的训练效果越好,预测的准确度越高。
参考图4,图4是本发明实施例提供的一种主观评价实际值与主观评价预测值的误差示意图。其中,工况可以指不同的车辆,本实施例并不限定误差计算公式。
图5是本发明实施例提供的一种声音品质评价方法的实现流程示意图,所述声音品质评价方法的执行主体为电子设备,电子设备包括台式电脑、笔记本电脑和服务器等。其中,所述服务器可以是实体的设备,也可以是部署在云端的虚拟化设备。参考图5,声音品质评价方法包括:
S501,采集驻车充电工况下的车内声音数据。
在一实施例中,所述采集驻车充电工况下的车内声音数据,包括:
采集主驾驶位和/或副驾驶位的左右耳位置点的声音数据。
例如,可以在汽车主驾驶位或副驾驶位的头枕左右两边固定四个传感器,利用四个传声器采集主驾驶员左右及副驾驶员左右耳四个布点的声音数据,根据声学测量标准ISO-3744、IS0-3745,采集不同剩余电量(SOC,StateOfCharge)工况下驻车充电的数据,截取其中5s稳定工况的车内声音数据用来预测。
S502,获取所述车内声音数据的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数。
设定参数是反映声音品质的客观参数,在一实施例中,所述多个设定参数包括以下至少两项:
线性声压级;
A计权声压级;
响度;
声强级SIL;
粗糙度;
尖锐度;
波动强度;
共轨油压。
S503,将所述多个第一参数的参数值输入设定模型,得到所述设定模型预测的对所述车内声音数据的声音品质评分;所述设定模型为径向基神经网络模型。
将车内声音数据的多个设定参数的参数值输入设定模型,设定模型输出该车内声音数据的声音品质评分。本实施例通过径向基神经网络模型预测驻车充电工况下的声音品质评分,避免组织评价团来进行主观评价,提高了声品质评价效率,且预测精确度有所保证,对后续驻车充电声品质优化有着较强的指导意义。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
需要说明的是,本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
另外,在本发明实施例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
参考图6,图6是本发明实施例提供的一种模型训练装置的示意图,如图6所示,该装置包括:
第一获取模块,用于获取训练样本集;所述训练样本集中的训练样本为驻车充电工况下的车内声音数据;
第二获取模块,用于获取每个训练样本对应的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
训练模块,用于基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型;所述设定模型为径向基神经网络模型,所述设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。
在一实施例中,所述装置还包括:
分析模块,用于对所述多个设定参数的参数值和主观评分进行相关性分析,得到每个设定参数与主观评分的相关系数;
对应地,所述训练模块具体用于:基于所述多个设定参数中相关系数大于第一阈值的设定参数的参数值,以及每个训练样本的主观评分,训练所述设定模型。
在一实施例中,所述装置还包括:
主观评分模块,用于获取多个评价人员输入的对每个训练样本的主观评分。
在一实施例中,所述装置还包括:
验证模块,用于基于验证样本集确定所述设定模型的预测误差;
在所述预测误差小于第二阈值的情况下,确定所述设定模型训练完成。
在一实施例中,所述多个设定参数包括以下至少两项:
线性声压级;
A计权声压级;
响度;
声强级SIL;
粗糙度;
尖锐度;
波动强度;
共轨油压。
参考图7,图7是本发明实施例提供的一种声音品质评价装置的示意图,如图7所示,该装置包括:
采集模块,用于采集驻车充电工况下的车内声音数据;
第三获取模块,用于获取所述车内声音数据的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
预测模块,用于将所述多个第一参数的参数值输入设定模型,得到所述设定模型预测的对所述车内声音数据的声音品质评分;所述设定模型为径向基神经网络模型。
实际应用时,所述预测模块、采集模块、训练模块、第一获取模块、第二获取模块和第三获取模块可通过电子设备中的处理器,比如中央处理器(CPU,CentralProcessingUnit)、数字信号处理器(DSP,DigitalSignalProcessor)、微控制单元(MCU,MicrocontrollerUnit)或可编程门阵列(FPGA,Field-ProgrammableGateArray)等实现。
需要说明的是:上述实施例提供的模型训练装置在进行模型训练时,仅以上述各模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的模块完成,即将装置的内部结构划分成不同的模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的模型训练装置与模型训练方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述模型训练装置可以是镜像文件形式,该镜像文件被执行后,可以以容器或者虚拟机的形式运行,以实现本申请所述的模型训练方法。当然也不局限为镜像文件形式,只要能够实现本申请所述的模型训练方法的一些软件形式都在本申请的保护范围之内。
基于上述程序模块的硬件实现,且为了实现本申请实施例的方法,本申请实施例还提供了一种电子设备。图8为本申请实施例电子设备的硬件组成结构示意图,如图8所示,电子设备包括:
通信接口,能够与其它设备比如网络设备等进行信息交互;
处理器,与所述通信接口连接,以实现与其它设备进行信息交互,用于运行计算机程序时,执行上述电子设备侧一个或多个技术方案提供的方法。而所述计算机程序存储在存储器上。
当然,实际应用时,电子设备中的各个组件通过总线系统耦合在一起。可理解,总线系统用于实现这些组件之间的连接通信。总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图8中将各种总线都标为总线系统。
上述电子设备可以是集群形式,比如是云计算平台形式,所谓云计算平台是采用计算虚拟化、网络虚拟化、存储虚拟化技术把多个独立的服务器物理硬件资源组织成池化资源的一种业务形态,它是一种基于虚拟化技术发展基础上软件定义资源的结构,可以提供虚拟机、容器等形态的资源能力。通过消除硬件与操作系统之间的固定关系,依赖网络的连通统一资源调度,然后提供所需要的虚拟资源和服务,是一种新型的IT,软件交付模式,具备灵活,弹性,分布式,多租户,按需等特点。
目前的云计算平台支持几种服务模式:
SaaS(SoftwareasaService,软件即服务):云计算平台用户无需购买软件,而改为租用部署于云计算平台的软件,用户无需对软件进行维护,软件服务提供商会全权管理和维护软件;
PaaS(PlatformasaService,平台即服务):云计算平台用户(此时通常为软件开发商)可以在云计算平台提供的架构上建设新的应用,或者扩展已有的应用,同时却不必购买开发、质量控制或生产服务器;
IaaS(InfrastructureasaService,基础架构即服务):云计算平台通过互联网提供了数据中心、基础架构硬件和软件资源,IaaS模式下的云计算平台可以提供服务器、操作系统、磁盘存储、数据库和/或信息资源。
本申请实施例中的存储器用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括:用于在电子设备上操作的任何计算机程序。
可以理解,存储器可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,ReadOnlyMemory)、可编程只读存储器(PROM,ProgrammableRead-Only Memory)、可擦除可编程只读存储器(EPROM,ErasableProgrammable Read-OnlyMemory)、电可擦除可编程只读存储器(EEPROM,Electrically ErasableProgrammableRead-OnlyMemory)、磁性随机存取存储器(FRAM,ferromagneticrandomaccessmemory)、快闪存储器(FlashMemory)、磁表面存储器、光盘、或只读光盘(CD-ROM,CompactDiscRead-OnlyMemory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,RandomAccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,StaticRandomAccessMemory)、同步静态随机存取存储器(SSRAM,SynchronousStaticRandomAccessMemory)、动态随机存取存储器(DRAM,DynamicRandomAccessMemory)、同步动态随机存取存储器(SDRAM,SynchronousDynamicRandomAccessMemory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,DoubleDataRateSynchronousDynamicRandomAccessMemory)、增强型同步动态随机存取存储器(ESDRAM,EnhancedSynchronousDynamicRandomAccessMemory)、同步连接动态随机存取存储器(SLDRAM,SyncLinkDynamicRandomAccessMemory)、直接内存总线随机存取存储器(DRRAM,DirectRambusRandomAccessMemory)。本申请实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
上述本申请实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的程序,结合其硬件完成前述方法的步骤。
可选地,所述处理器执行所述程序时实现本申请实施例的各个方法中由电子设备实现的相应流程,为了简洁,在此不再赘述。
在示例性实施例中,本申请实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的第一存储器,上述计算机程序可由电子设备的处理器执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置、电子设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本申请实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
另外,在本申请实例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (11)
1.一种模型训练方法,其特征在于,所述方法包括:
获取训练样本集;所述训练样本集中的训练样本为驻车充电工况下的车内声音数据;
获取每个训练样本对应的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型;所述设定模型为径向基神经网络模型,所述设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。
2.根据权利要求1所述的方法,其特征在于,所述获取每个训练样本对应的多个设定参数的参数值之后,所述方法还包括:
对所述多个设定参数的参数值和主观评分进行相关性分析,得到每个设定参数与主观评分的相关系数;
对应地,所述基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型,包括:
基于所述多个设定参数中相关系数大于第一阈值的设定参数的参数值,以及每个训练样本的主观评分,训练所述设定模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个评价人员输入的对每个训练样本的主观评分。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于验证样本集确定所述设定模型的预测误差;
在所述预测误差小于第二阈值的情况下,确定所述设定模型训练完成。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述多个设定参数包括以下至少两项:
线性声压级;
A计权声压级;
响度;
声强级SIL;
粗糙度;
尖锐度;
波动强度;
共轨油压。
6.一种基于权利要求1至4任一项所述方法训练得到的设定模型的声音品质评价方法,其特征在于,所述方法包括:
采集驻车充电工况下的车内声音数据;
获取所述车内声音数据的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
将所述多个第一参数的参数值输入设定模型,得到所述设定模型预测的对所述车内声音数据的声音品质评分;所述设定模型为径向基神经网络模型。
7.根据权利要求6所述的方法,其特征在于,所述采集驻车充电工况下的车内声音数据,包括:
采集主驾驶位和/或副驾驶位的左右耳位置点的声音数据。
8.一种模型训练装置,其特征在于,包括:
第一获取模块,用于获取训练样本集;所述训练样本集中的训练样本为驻车充电工况下的车内声音数据;
第二获取模块,用于获取每个训练样本对应的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
训练模块,用于基于每个训练样本对应的多个设定参数的参数值,以及每个训练样本的主观评分,训练设定模型;所述设定模型为径向基神经网络模型,所述设定模型用于预测驻车充电工况下的车内声音数据的声音品质评分。
9.一种声音品质评价装置,其特征在于,包括:
采集模块,用于采集驻车充电工况下的车内声音数据;
第三获取模块,用于获取所述车内声音数据的多个设定参数的参数值,每个设定参数表征一种反映声音品质的客观参数;
预测模块,用于将所述多个第一参数的参数值输入设定模型,得到所述设定模型预测的对所述车内声音数据的声音品质评分;所述设定模型为径向基神经网络模型。
10.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5所述的模型训练方法或实现如权利要求6至7所述的声音品质评价方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1至5所述的模型训练方法或执行如权利要求6至7所述的声音品质评价方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310501432.XA CN116564346A (zh) | 2023-04-27 | 2023-04-27 | 模型训练及声音品质评价方法、装置、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310501432.XA CN116564346A (zh) | 2023-04-27 | 2023-04-27 | 模型训练及声音品质评价方法、装置、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116564346A true CN116564346A (zh) | 2023-08-08 |
Family
ID=87492537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310501432.XA Pending CN116564346A (zh) | 2023-04-27 | 2023-04-27 | 模型训练及声音品质评价方法、装置、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564346A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117041858A (zh) * | 2023-08-14 | 2023-11-10 | 央广云听文化传媒有限公司 | 空间音频播放优化方法和装置 |
-
2023
- 2023-04-27 CN CN202310501432.XA patent/CN116564346A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117041858A (zh) * | 2023-08-14 | 2023-11-10 | 央广云听文化传媒有限公司 | 空间音频播放优化方法和装置 |
CN117041858B (zh) * | 2023-08-14 | 2024-04-09 | 央广云听文化传媒有限公司 | 空间音频播放优化方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Sound quality prediction of vehicle interior noise using deep belief networks | |
US20210188290A1 (en) | Driving model training method, driver identification method, apparatuses, device and medium | |
CN110399238B (zh) | 一种磁盘故障预警方法、装置、设备及可读存储介质 | |
KR20190032495A (ko) | 평가 모델에 대한 모델링 방법 및 디바이스 | |
CN116564346A (zh) | 模型训练及声音品质评价方法、装置、电子设备 | |
CN112508580A (zh) | 基于拒绝推断方法的模型构建方法、装置和电子设备 | |
CN114815605A (zh) | 自动驾驶测试用例生成方法、装置、电子设备及存储介质 | |
CA3161968A1 (en) | Systems and methods for automatic model generation | |
CN111326169A (zh) | 一种语音质量的评价方法及装置 | |
So et al. | Cost-sensitive multi-class adaboost for understanding driving behavior based on telematics | |
Huang et al. | Multitarget prediction and optimization of pure electric vehicle tire/road airborne noise sound quality based on a knowledge-and data-driven method | |
CN112766578A (zh) | 一种基于车辆网的车辆用途识别方法、系统及存储介质 | |
CN114384896A (zh) | 轨道交通列控车载设备模拟电路级健康度预测方法及系统 | |
CN113539460A (zh) | 用于远程医疗平台的智能导诊方法和装置 | |
Guo et al. | Research on the integrated system of case-based reasoning and Bayesian network | |
CN116777642A (zh) | 基于集成学习模型的车险风险参数预测方法及装置 | |
CN114578234A (zh) | 一种考虑因果性特征的锂离子电池退化与容量预测模型 | |
CN113886454A (zh) | 一种基于lstm-rbf的云资源预测方法 | |
CN108510003A (zh) | 车联网大数据风控组合特征提取方法、装置及存储介质 | |
CN116316699A (zh) | 一种大电网频率安全态势预测方法、装置及存储介质 | |
WO2023193196A1 (zh) | 自动驾驶测试用例生成方法、装置、电子设备及存储介质 | |
CN116011995A (zh) | 车辆保养信息推送方法、装置、电子设备及存储介质 | |
CN115841712A (zh) | 一种基于v2x技术的驾驶数据处理方法、装置及设备 | |
Liang et al. | Failure mode and effect analysis by exploiting text mining and multi-view group consensus for the defect detection of electric vehicles in social media data | |
CN114492967A (zh) | 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |