发明内容
本发明主要解决的技术问题如何准确确定汽车音箱参数,减少气流噪音的干扰。
根据第一方面,本发明提供一种基于人工智能和大数据分析的音箱参数确定方法,包括:获取汽车的全景图像;基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;获取汽车内部的实时监控视频和汽车车速;基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
更进一步地,所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
更进一步地,所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
更进一步地,所述方法还包括:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。
更进一步地,所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
根据第二方面,本发明提供一种基于人工智能和大数据分析的音箱参数确定系统,包括:第一获取模块,用于获取汽车的全景图像;空间布局确定模块,用于基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;第二获取模块,用于获取汽车内部的实时监控视频和汽车车速;监控处理模块,用于基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;进风确定模块,用于基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;噪音确定模块,用于基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;处理模块,用于构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;音箱参数确定模块,用于基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
更进一步地,所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
更进一步地,所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
更进一步地,所述系统还用于:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。
更进一步地,所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
本发明提供的一种基于人工智能和大数据分析的音箱参数确定方法和系统,该方法包括获取汽车的全景图像;基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;获取汽车内部的实时监控视频和汽车车速;基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。该方法能够准确确定汽车音箱参数,减少气流噪音的干扰。
具体实施方式
本发明实施例中,提供了如图1所示的一种基于人工智能和大数据分析的音箱参数确定方法,所述基于人工智能和大数据分析的音箱参数确定方法包括步骤S1~S8:
步骤S1,获取汽车的全景图像。
汽车的全景图像是指使用摄像设备(如车顶或内部摄像头)对整个汽车内部空间进行拍摄或获取图像。全景图像可以提供汽车内部布局信息。
在一些实施例中,可以通过车载摄像头获取汽车内部前排座椅、后排座椅和车门等位置信息的全景图像。这些图像可以包括在嵌入式显示屏上或通过连接到移动设备的应用程序中显示。
通过了解汽车内部的布局,可以更好地调整音箱参数,以减少气流噪音的干扰。
步骤S2,基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱。
座椅分布信息包括汽车内部座椅的位置、倾斜角度以及座椅之间的相对位置关系。
车门信息包括汽车四个车门的开闭状态,以及车门内部结构和布局。
汽车内饰信息包括汽车内部的装饰和布局,包括仪表盘、中控台、座椅材质等。
在一些实施例中,可以通过全景图像处理模型对所述汽车的全景图像进行处理确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息。全景图像处理模型为卷积神经网络模型,卷积神经网络(CNN)可以是多层神经网络(例如,包括至少两个层)。所述至少两个层可以包括卷积层(CONV)、修正线性单元(ReLU)层、池化层(POOL)或全连接层(FC)中的至少一个。卷积神经网络能够从图像中提取有用特征,并逐渐理解和学习图像的上下文信息。所述全景图像处理模型的输入为所述汽车的全景图像,所述全景图像处理模型的输出为汽车内部空间布局信息。卷积神经网络为人工智能的一种实现方式。
步骤S3,获取汽车内部的实时监控视频和汽车车速。
汽车内部的实时监控视频是指通过内置摄像头或摄像设备实时捕获汽车内部的视频画面。
步骤S4,基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
门控循环单元(Gated Recurrent Unit,GRU)用于处理序列数据和时序信息。门控循环单元包括记忆单元、更新门和重置门三个组件。通过门控循环单元模型可以处理连续时间段的所述汽车内部的实时监控视频,可以更好地捕捉到所述汽车内部的实时监控视频时间序列中的关系,能够输出得到综合考虑了各个时间点的所述汽车内部的实时监控视频之间关联关系的特征,使得该输出的特征更加的准确和全面。门控循环单元具有一定的记忆能力,可以对时序数据进行建模和预测。基于所述汽车内部的实时监控视频,门控循环单元可以通过学习视频中的特征和模式,从中提取出与司机信息、车窗打开面积以及音箱到司机耳朵的距离相关的信息。门控循环单元通过分析监控视频中的司机相关特征,如面部特征、头部姿态、身体状态等,门控循环单元可以学习到这些特征与司机信息之间的关联,还可以学习到车窗状态与车窗打开面积之间的关系,通过分析监控视频中的车内布局和音箱位置,门控循环单元还可以学习到音箱与司机耳朵之间的距离关系。门控循环单元能够基于所述汽车内部的实时监控视频确定司机信息、车窗的打开面积以及每个音箱到司机耳朵的距离,是因为它通过学习视频中的特征和模式,能够提取这些信息之间的关联,并进行相应的预测和估计。门控循环单元为人工智能的一种实现方式。
司机耳朵位置指的是司机的耳朵相对于车辆内部的位置。通过确定司机耳朵的位置,可以更好地调整音箱的输出,使其更准确地传达到司机的听觉感知区域。
司机年龄是指司机当前的年龄。例如,对于年龄较大的司机,系统可以根据他们的听力状况和反应时间调整声音的音量。
头发对耳朵的遮挡程度指的是司机的头发对于耳朵的遮挡程度。这个信息可以影响声音传输到司机耳朵的效果。例如,如果司机有长发,可能需要调整音箱的音量和均衡器参数,以确保声音能够穿透头发,传达到司机的耳朵。头发对耳朵的遮挡程度可以为0-1之间的数值,数值越大,则说明头发对耳朵的遮挡程度越大,数值为1时,则说明头发对耳朵已经完全遮挡,数值为0时,则说明头发对耳朵完全没有遮挡。
车窗打开面积指的是车辆车窗当前打开的面积大小,这个信息可以用于后续评估车内空气流通情况。
每个音箱到司机耳朵的距离是指车辆音箱系统中每个音箱到司机耳朵的实际距离。这个信息可以用于调整音量和音频平衡,以提供更好的听觉体验。
在一实施例中,监控处理模型包括司机视频确定子模型、司机信息确定子模型。司机视频确定子模型的输入为汽车内部的实时监控视频,司机信息确定子模型的输出为分割后的司机视频,耳朵遮挡程度确定子模型的输入为分割后的司机视频,耳朵遮挡程度确定子模型的输出为司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
步骤S5,基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量。
汽车每秒的进风量指单位时间内进入汽车内部的空气量。以体积单位来表示,如立方米/秒(m3/s)。进风量可以通过汽车车速和司机车窗的打开面积来计算。
在一些实施例中,可以将所述汽车车速和所述车窗的打开面积构建为一个待匹配向量,通过计算该待匹配向量与数据库中每个参考向量的距离,将距离小于阈值的参考向量对应的汽车每秒的进风量确定为汽车每秒的进风量。数据库是预先构建的,所述数据库中包括参考向量和参考向量对应的汽车每秒的进风量,参考向量基于历史数据中的汽车车速和车窗的打开面积构建得到,参考向量对应的汽车每秒的进风量为历史数据中确定好的汽车每秒的进风量。
在一些实施例中,可以通过查询汽车每秒的进风量预设表的方式确定汽车每秒的进风量。其中,汽车每秒的进风量预设表中包括每种汽车车速和每种车窗的打开面积及对应的复发率,汽车每秒的进风量预设表可以基于历史数据人为构建得到。
步骤S6,基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息。
气流传到司机耳朵时的气流噪音频率信息指在汽车内部气流传到司机耳朵位置时,噪音所包含的不同频率成分的信息。作为示例,当气流传到司机耳朵时,可能产生20Hz、100Hz和1000Hz等不同频率的噪音成分。
气流传到司机耳朵时的气流噪音强度信息指在汽车内部气流传到司机耳朵位置时,噪音的强度或音量大小的信息。作为示例,当气流传到司机耳朵时,噪音的强度可以用分贝(dB)来表示,例如80dB。
在一些实施例中,可以基于气流确定模型确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息。气流确定模型可以为人工神经网络模型(Artificial Neural Network,ANN)。人工神经网络模型的基本结构包括输入层、隐藏层和输出层。输入层接收外部输入数据,隐藏层负责对输入数据进行加工和处理,最终将结果传递给输出层,输出层产生最终的预测或分类结果。人工神经网络通过反向传播算法进行训练,该算法通过不断调整连接权重,使网络能够学习并适应特定的任务。人工神经网络包含多个隐藏层,从而能够学习到更加复杂的特征和关系。通过训练,人工神经网络可以从大量的输入数据中学习到复杂的非线性关系,并将这些关系映射到期望的输出结果。在这种情况下,神经网络可以从汽车进风量、空间布局信息和司机耳朵位置等输入数据中学习到气流噪音的生成规律和特征,从而推断出气流传到司机耳朵时的频率信息和噪音强度信息。
在一些实施例中,气流确定模型包括内部气流流动确定层和司机耳朵气流噪音确定层,内部气流流动确定层和司机耳朵气流噪音确定层都为人工神经网络,内部气流流动确定层的输入为所述汽车每秒的进风量、所述汽车内部空间布局信息,内部气流流动确定层的输出为汽车内部气流流动信息,所述司机耳朵气流噪音确定层的输入为汽车内部气流流动信息和所述司机耳朵位置,所述司机耳朵气流噪音确定层的输出为气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息。汽车内部气流流动信息指在汽车内部空间中空气的流动情况,汽车内部气流流动信息包括汽车内部空间中空气的气流的方向、速度、湍流程度。
通过内部气流流动确定层的人工神经网络,结合汽车每秒的进风量和内部空间布局信息,能够精确预测汽车内部气流流动信息,包括气流的方向、速度等参数。通过司机耳朵气流噪音确定层的人工神经网络,以汽车内部气流流动信息为输入,可以预测气流传到司机耳朵时的噪音频率和强度。模型分为两个层可以使得模型更具可解释性和可操作性。每个层的输入和输出都有明确的物理意义,使得模型能够更清晰地理解和空气流动和噪音的影响因素。这种设计也使得模型更容易进行调试和优化,以达到更好的效果。
在一些实施例中,强度阈值可以手动人为提前设定。
在一些实施例中,所述方法还包括:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。在一些实施例中,强度阈值可以通过以下公式确定:
其中H为强度阈值,X表示汽车每秒的进风量,Y表示头发对耳朵的遮挡程度,Z表示气流传到司机耳朵时的气流噪音的气流噪音的强度信息,V为汽车车速,α和β是预设的权重系数以用于调节参数对强度阈值的影响程度。
步骤S7,构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离。
在图结构数据中,节点表示实体或概念,每个节点包含一组特征,用于描述该实体的属性或状态。在本申请中,节点包括司机节点和四个音箱节点。
边在图结构数据中,边表示节点之间的关系。在本申请中四条边分别表示每个音箱到司机耳朵的距离,用于描述声音传播路径。
气流传到司机耳朵时的气流噪音的频率信息和气流噪音的强度信息可以影响司机对声音的感知和接受程度,从而影响到对音箱参数的需求。
司机耳朵位置、年龄、性别、体重、头发对耳朵的遮挡程度这些个人特征会影响声音在空间中的传播,以及对声音的感知能力。
音箱所在的具体位置以及音箱本身的技术参数会直接影响到产生的声音特性。
所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
音箱尺寸是指音箱的物理外形和尺寸大小。
音箱功率是指音箱能够输出的电功率大小。
音箱频率响应范围是指音箱能够有效输出声音的频率范围,通常以赫兹(Hz)为单位来表示。
步骤S7建立了一个更加精确和全面的声学模型,以便研究和优化车辆内部的音箱系统。通过构建节点和边的关系图模型,可以清晰地描述司机节点和音箱节点之间的联系、声音在车内传播的路径和影响因素以及进入司机所听到的噪声情况。这有助于更好地理解和控制音箱系统的效果,可以更好的减少气流噪音的干扰、提高驾驶员的听觉体验。
步骤S8,基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
图神经网络模型包括图神经网络(GraphNeural Network,GNN)和全连接层,图神经网络是一种直接作用于图结构数据上的神经网络,图结构数据是由节点和边两部分组成的一种数据结构。
所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
音箱的音量指的是音箱的输出音频信号的强度或声音大小。
均衡器参数用来描述音箱内置的均衡器对不同频率声音的调节情况,均衡器参数包括高音、中音和低音等频段的增益或衰减值。通过均衡器参数的调整,可以优化音频的频率响应,使得音乐中的特定频率范围更突出。作为示例,如果窗外的气流噪音主要集中在某些频率范围内,可以通过降低这些频率范围的音量来减小气流噪音的影响。
低音增强技术可以增加低频音效,使得音乐中的低音更加强烈和有力。
高音增强技术可以增加高频音效,使得音乐中的高音更加明亮和清晰。
低音增强和高音增强可以改善音乐的细节和逼真感,外部气流噪音可能会对低频段或高频段的声音产生干扰,通过适当增强低音或高音,可以使人耳更加关注音频内容,从而减少对气流噪音干扰的影响。
图神经网络模型的输入为所述五个节点和四条边,图神经网络模型的输出为每个音箱的音箱参数。在图神经网络中,节点通过与其相邻节点进行信息交换和聚合来更新自身的表示。司机节点和音箱节点之间通过边相连,这些边上携带了声音传播路径和距离等信息。图神经网络通过迭代将节点的特征信息进行聚合和传播,可以在整个图结构中传递并更新信息,从而使得每个节点能够获得全局范围内的特征表示。图神经网络模型将司机节点和音箱节点的特征进行有效的整合和更新,从而为确定音箱参数提供有用的信息。图神经网络具有端到端的学习能力,可以直接从输入的图结构中学习节点和边之间的复杂关系,并输出音箱参数。通过反向传播算法和梯度下降等方法,图神经网络可以自动学习如何有效地利用图结构中的信息来预测音箱参数,以达到减小气流噪音的影响,最终提供更清晰、更符合用户期望的音箱声音。
基于同一发明构思,图2为本发明的实施例提供的一种基于人工智能和大数据分析的音箱参数确定系统示意图,所述基于人工智能和大数据分析的音箱参数确定系统包括:
第一获取模块21,用于获取汽车的全景图像;
空间布局确定模块22,用于基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;
第二获取模块23,用于获取汽车内部的实时监控视频和汽车车速;
监控处理模块24,用于基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;
进风确定模块25,用于基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;
噪音确定模块26,用于基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;
处理模块27,用于构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;
音箱参数确定模块28,用于基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。