CN117520788B - 基于人工智能和大数据分析的音箱参数确定方法和系统 - Google Patents

基于人工智能和大数据分析的音箱参数确定方法和系统 Download PDF

Info

Publication number
CN117520788B
CN117520788B CN202410017068.4A CN202410017068A CN117520788B CN 117520788 B CN117520788 B CN 117520788B CN 202410017068 A CN202410017068 A CN 202410017068A CN 117520788 B CN117520788 B CN 117520788B
Authority
CN
China
Prior art keywords
driver
automobile
sound box
information
ear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410017068.4A
Other languages
English (en)
Other versions
CN117520788A (zh
Inventor
和彩霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Flash Mutual Technology Guangdong Co ltd
Original Assignee
Chengdu Yadu Kesheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Yadu Kesheng Technology Co ltd filed Critical Chengdu Yadu Kesheng Technology Co ltd
Priority to CN202410017068.4A priority Critical patent/CN117520788B/zh
Publication of CN117520788A publication Critical patent/CN117520788A/zh
Application granted granted Critical
Publication of CN117520788B publication Critical patent/CN117520788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明提供的一种基于人工智能和大数据分析的音箱参数确定方法和系统,本发明涉及音箱参数确定技术领域,该方法包括基于汽车的全景图像确定汽车内部空间布局信息;基于汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离;基于汽车车速和车窗的打开面积确定汽车每秒的进风量;基于汽车每分钟的进风量、汽车内部空间布局信息和司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;构建五个节点和四条边;基于图神经网络模型对五个节点和四条边进行处理确定每个音箱的音箱参数。该方法能够准确确定汽车音箱参数,减少气流噪音的干扰。

Description

基于人工智能和大数据分析的音箱参数确定方法和系统
技术领域
本发明涉及音箱参数确定技术领域,具体涉及一种基于人工智能和大数据分析的音箱参数确定方法和系统。
背景技术
智能化设备已经深入到各个领域。在汽车领域,智能化设备的应用也越来越广泛。其中,车载音箱是汽车内部的一个重要组成部分,它能够提供音乐播放、导航提示、语音交互等功能。然而,当汽车开窗后,外部气流会进入车内,这会导致气流噪音的产生。这种气流噪音会干扰音箱系统的声音输出,使得乘客和司机难以听清音箱的声音。尤其在高速行驶或外部环境噪音较大的情况下,这个问题更加明显。因此,需要调整音箱的参数以优化音箱系统的声音输出,减少气流噪音对音箱声音的影响。传统的汽车音箱参数的调整方法往往都是司机人为手动调整,这种方法不仅耗时耗力,而且很难达到理想的减少气流噪音效果。
因此如何准确确定汽车音箱参数,减少气流噪音的干扰是当前亟待解决的问题。
发明内容
本发明主要解决的技术问题如何准确确定汽车音箱参数,减少气流噪音的干扰。
根据第一方面,本发明提供一种基于人工智能和大数据分析的音箱参数确定方法,包括:获取汽车的全景图像;基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;获取汽车内部的实时监控视频和汽车车速;基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
更进一步地,所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
更进一步地,所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
更进一步地,所述方法还包括:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。
更进一步地,所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
根据第二方面,本发明提供一种基于人工智能和大数据分析的音箱参数确定系统,包括:第一获取模块,用于获取汽车的全景图像;空间布局确定模块,用于基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;第二获取模块,用于获取汽车内部的实时监控视频和汽车车速;监控处理模块,用于基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;进风确定模块,用于基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;噪音确定模块,用于基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;处理模块,用于构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;音箱参数确定模块,用于基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
更进一步地,所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
更进一步地,所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
更进一步地,所述系统还用于:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。
更进一步地,所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
本发明提供的一种基于人工智能和大数据分析的音箱参数确定方法和系统,该方法包括获取汽车的全景图像;基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;获取汽车内部的实时监控视频和汽车车速;基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。该方法能够准确确定汽车音箱参数,减少气流噪音的干扰。
附图说明
图1为本发明实施例提供的一种基于人工智能和大数据分析的音箱参数确定方法的流程示意图;
图2为本发明实施例提供的一种基于人工智能和大数据分析的音箱参数确定系统的示意图。
具体实施方式
本发明实施例中,提供了如图1所示的一种基于人工智能和大数据分析的音箱参数确定方法,所述基于人工智能和大数据分析的音箱参数确定方法包括步骤S1~S8:
步骤S1,获取汽车的全景图像。
汽车的全景图像是指使用摄像设备(如车顶或内部摄像头)对整个汽车内部空间进行拍摄或获取图像。全景图像可以提供汽车内部布局信息。
在一些实施例中,可以通过车载摄像头获取汽车内部前排座椅、后排座椅和车门等位置信息的全景图像。这些图像可以包括在嵌入式显示屏上或通过连接到移动设备的应用程序中显示。
通过了解汽车内部的布局,可以更好地调整音箱参数,以减少气流噪音的干扰。
步骤S2,基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱。
座椅分布信息包括汽车内部座椅的位置、倾斜角度以及座椅之间的相对位置关系。
车门信息包括汽车四个车门的开闭状态,以及车门内部结构和布局。
汽车内饰信息包括汽车内部的装饰和布局,包括仪表盘、中控台、座椅材质等。
在一些实施例中,可以通过全景图像处理模型对所述汽车的全景图像进行处理确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息。全景图像处理模型为卷积神经网络模型,卷积神经网络(CNN)可以是多层神经网络(例如,包括至少两个层)。所述至少两个层可以包括卷积层(CONV)、修正线性单元(ReLU)层、池化层(POOL)或全连接层(FC)中的至少一个。卷积神经网络能够从图像中提取有用特征,并逐渐理解和学习图像的上下文信息。所述全景图像处理模型的输入为所述汽车的全景图像,所述全景图像处理模型的输出为汽车内部空间布局信息。卷积神经网络为人工智能的一种实现方式。
步骤S3,获取汽车内部的实时监控视频和汽车车速。
汽车内部的实时监控视频是指通过内置摄像头或摄像设备实时捕获汽车内部的视频画面。
步骤S4,基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
门控循环单元(Gated Recurrent Unit,GRU)用于处理序列数据和时序信息。门控循环单元包括记忆单元、更新门和重置门三个组件。通过门控循环单元模型可以处理连续时间段的所述汽车内部的实时监控视频,可以更好地捕捉到所述汽车内部的实时监控视频时间序列中的关系,能够输出得到综合考虑了各个时间点的所述汽车内部的实时监控视频之间关联关系的特征,使得该输出的特征更加的准确和全面。门控循环单元具有一定的记忆能力,可以对时序数据进行建模和预测。基于所述汽车内部的实时监控视频,门控循环单元可以通过学习视频中的特征和模式,从中提取出与司机信息、车窗打开面积以及音箱到司机耳朵的距离相关的信息。门控循环单元通过分析监控视频中的司机相关特征,如面部特征、头部姿态、身体状态等,门控循环单元可以学习到这些特征与司机信息之间的关联,还可以学习到车窗状态与车窗打开面积之间的关系,通过分析监控视频中的车内布局和音箱位置,门控循环单元还可以学习到音箱与司机耳朵之间的距离关系。门控循环单元能够基于所述汽车内部的实时监控视频确定司机信息、车窗的打开面积以及每个音箱到司机耳朵的距离,是因为它通过学习视频中的特征和模式,能够提取这些信息之间的关联,并进行相应的预测和估计。门控循环单元为人工智能的一种实现方式。
司机耳朵位置指的是司机的耳朵相对于车辆内部的位置。通过确定司机耳朵的位置,可以更好地调整音箱的输出,使其更准确地传达到司机的听觉感知区域。
司机年龄是指司机当前的年龄。例如,对于年龄较大的司机,系统可以根据他们的听力状况和反应时间调整声音的音量。
头发对耳朵的遮挡程度指的是司机的头发对于耳朵的遮挡程度。这个信息可以影响声音传输到司机耳朵的效果。例如,如果司机有长发,可能需要调整音箱的音量和均衡器参数,以确保声音能够穿透头发,传达到司机的耳朵。头发对耳朵的遮挡程度可以为0-1之间的数值,数值越大,则说明头发对耳朵的遮挡程度越大,数值为1时,则说明头发对耳朵已经完全遮挡,数值为0时,则说明头发对耳朵完全没有遮挡。
车窗打开面积指的是车辆车窗当前打开的面积大小,这个信息可以用于后续评估车内空气流通情况。
每个音箱到司机耳朵的距离是指车辆音箱系统中每个音箱到司机耳朵的实际距离。这个信息可以用于调整音量和音频平衡,以提供更好的听觉体验。
在一实施例中,监控处理模型包括司机视频确定子模型、司机信息确定子模型。司机视频确定子模型的输入为汽车内部的实时监控视频,司机信息确定子模型的输出为分割后的司机视频,耳朵遮挡程度确定子模型的输入为分割后的司机视频,耳朵遮挡程度确定子模型的输出为司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度。
步骤S5,基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量。
汽车每秒的进风量指单位时间内进入汽车内部的空气量。以体积单位来表示,如立方米/秒(m3/s)。进风量可以通过汽车车速和司机车窗的打开面积来计算。
在一些实施例中,可以将所述汽车车速和所述车窗的打开面积构建为一个待匹配向量,通过计算该待匹配向量与数据库中每个参考向量的距离,将距离小于阈值的参考向量对应的汽车每秒的进风量确定为汽车每秒的进风量。数据库是预先构建的,所述数据库中包括参考向量和参考向量对应的汽车每秒的进风量,参考向量基于历史数据中的汽车车速和车窗的打开面积构建得到,参考向量对应的汽车每秒的进风量为历史数据中确定好的汽车每秒的进风量。
在一些实施例中,可以通过查询汽车每秒的进风量预设表的方式确定汽车每秒的进风量。其中,汽车每秒的进风量预设表中包括每种汽车车速和每种车窗的打开面积及对应的复发率,汽车每秒的进风量预设表可以基于历史数据人为构建得到。
步骤S6,基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息。
气流传到司机耳朵时的气流噪音频率信息指在汽车内部气流传到司机耳朵位置时,噪音所包含的不同频率成分的信息。作为示例,当气流传到司机耳朵时,可能产生20Hz、100Hz和1000Hz等不同频率的噪音成分。
气流传到司机耳朵时的气流噪音强度信息指在汽车内部气流传到司机耳朵位置时,噪音的强度或音量大小的信息。作为示例,当气流传到司机耳朵时,噪音的强度可以用分贝(dB)来表示,例如80dB。
在一些实施例中,可以基于气流确定模型确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息。气流确定模型可以为人工神经网络模型(Artificial Neural Network,ANN)。人工神经网络模型的基本结构包括输入层、隐藏层和输出层。输入层接收外部输入数据,隐藏层负责对输入数据进行加工和处理,最终将结果传递给输出层,输出层产生最终的预测或分类结果。人工神经网络通过反向传播算法进行训练,该算法通过不断调整连接权重,使网络能够学习并适应特定的任务。人工神经网络包含多个隐藏层,从而能够学习到更加复杂的特征和关系。通过训练,人工神经网络可以从大量的输入数据中学习到复杂的非线性关系,并将这些关系映射到期望的输出结果。在这种情况下,神经网络可以从汽车进风量、空间布局信息和司机耳朵位置等输入数据中学习到气流噪音的生成规律和特征,从而推断出气流传到司机耳朵时的频率信息和噪音强度信息。
在一些实施例中,气流确定模型包括内部气流流动确定层和司机耳朵气流噪音确定层,内部气流流动确定层和司机耳朵气流噪音确定层都为人工神经网络,内部气流流动确定层的输入为所述汽车每秒的进风量、所述汽车内部空间布局信息,内部气流流动确定层的输出为汽车内部气流流动信息,所述司机耳朵气流噪音确定层的输入为汽车内部气流流动信息和所述司机耳朵位置,所述司机耳朵气流噪音确定层的输出为气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息。汽车内部气流流动信息指在汽车内部空间中空气的流动情况,汽车内部气流流动信息包括汽车内部空间中空气的气流的方向、速度、湍流程度。
通过内部气流流动确定层的人工神经网络,结合汽车每秒的进风量和内部空间布局信息,能够精确预测汽车内部气流流动信息,包括气流的方向、速度等参数。通过司机耳朵气流噪音确定层的人工神经网络,以汽车内部气流流动信息为输入,可以预测气流传到司机耳朵时的噪音频率和强度。模型分为两个层可以使得模型更具可解释性和可操作性。每个层的输入和输出都有明确的物理意义,使得模型能够更清晰地理解和空气流动和噪音的影响因素。这种设计也使得模型更容易进行调试和优化,以达到更好的效果。
在一些实施例中,强度阈值可以手动人为提前设定。
在一些实施例中,所述方法还包括:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。在一些实施例中,强度阈值可以通过以下公式确定:
其中H为强度阈值,X表示汽车每秒的进风量,Y表示头发对耳朵的遮挡程度,Z表示气流传到司机耳朵时的气流噪音的气流噪音的强度信息,V为汽车车速,α和β是预设的权重系数以用于调节参数对强度阈值的影响程度。
步骤S7,构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离。
在图结构数据中,节点表示实体或概念,每个节点包含一组特征,用于描述该实体的属性或状态。在本申请中,节点包括司机节点和四个音箱节点。
边在图结构数据中,边表示节点之间的关系。在本申请中四条边分别表示每个音箱到司机耳朵的距离,用于描述声音传播路径。
气流传到司机耳朵时的气流噪音的频率信息和气流噪音的强度信息可以影响司机对声音的感知和接受程度,从而影响到对音箱参数的需求。
司机耳朵位置、年龄、性别、体重、头发对耳朵的遮挡程度这些个人特征会影响声音在空间中的传播,以及对声音的感知能力。
音箱所在的具体位置以及音箱本身的技术参数会直接影响到产生的声音特性。
所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
音箱尺寸是指音箱的物理外形和尺寸大小。
音箱功率是指音箱能够输出的电功率大小。
音箱频率响应范围是指音箱能够有效输出声音的频率范围,通常以赫兹(Hz)为单位来表示。
步骤S7建立了一个更加精确和全面的声学模型,以便研究和优化车辆内部的音箱系统。通过构建节点和边的关系图模型,可以清晰地描述司机节点和音箱节点之间的联系、声音在车内传播的路径和影响因素以及进入司机所听到的噪声情况。这有助于更好地理解和控制音箱系统的效果,可以更好的减少气流噪音的干扰、提高驾驶员的听觉体验。
步骤S8,基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
图神经网络模型包括图神经网络(GraphNeural Network,GNN)和全连接层,图神经网络是一种直接作用于图结构数据上的神经网络,图结构数据是由节点和边两部分组成的一种数据结构。
所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
音箱的音量指的是音箱的输出音频信号的强度或声音大小。
均衡器参数用来描述音箱内置的均衡器对不同频率声音的调节情况,均衡器参数包括高音、中音和低音等频段的增益或衰减值。通过均衡器参数的调整,可以优化音频的频率响应,使得音乐中的特定频率范围更突出。作为示例,如果窗外的气流噪音主要集中在某些频率范围内,可以通过降低这些频率范围的音量来减小气流噪音的影响。
低音增强技术可以增加低频音效,使得音乐中的低音更加强烈和有力。
高音增强技术可以增加高频音效,使得音乐中的高音更加明亮和清晰。
低音增强和高音增强可以改善音乐的细节和逼真感,外部气流噪音可能会对低频段或高频段的声音产生干扰,通过适当增强低音或高音,可以使人耳更加关注音频内容,从而减少对气流噪音干扰的影响。
图神经网络模型的输入为所述五个节点和四条边,图神经网络模型的输出为每个音箱的音箱参数。在图神经网络中,节点通过与其相邻节点进行信息交换和聚合来更新自身的表示。司机节点和音箱节点之间通过边相连,这些边上携带了声音传播路径和距离等信息。图神经网络通过迭代将节点的特征信息进行聚合和传播,可以在整个图结构中传递并更新信息,从而使得每个节点能够获得全局范围内的特征表示。图神经网络模型将司机节点和音箱节点的特征进行有效的整合和更新,从而为确定音箱参数提供有用的信息。图神经网络具有端到端的学习能力,可以直接从输入的图结构中学习节点和边之间的复杂关系,并输出音箱参数。通过反向传播算法和梯度下降等方法,图神经网络可以自动学习如何有效地利用图结构中的信息来预测音箱参数,以达到减小气流噪音的影响,最终提供更清晰、更符合用户期望的音箱声音。
基于同一发明构思,图2为本发明的实施例提供的一种基于人工智能和大数据分析的音箱参数确定系统示意图,所述基于人工智能和大数据分析的音箱参数确定系统包括:
第一获取模块21,用于获取汽车的全景图像;
空间布局确定模块22,用于基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;
第二获取模块23,用于获取汽车内部的实时监控视频和汽车车速;
监控处理模块24,用于基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;
进风确定模块25,用于基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;
噪音确定模块26,用于基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;
处理模块27,用于构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;
音箱参数确定模块28,用于基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。

Claims (8)

1.一种基于人工智能和大数据分析的音箱参数确定方法,其特征在于,包括:
获取汽车的全景图像;
基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;
获取汽车内部的实时监控视频和汽车车速;
基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;
基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;
基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;
构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;
基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
2.如权利要求1所述的基于人工智能和大数据分析的音箱参数确定方法,其特征在于,所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
3.如权利要求1所述的基于人工智能和大数据分析的音箱参数确定方法,其特征在于,所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
4.如权利要求1所述的基于人工智能和大数据分析的音箱参数确定方法,其特征在于,所述方法还包括:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。
5.一种基于人工智能和大数据分析的音箱参数确定系统,其特征在于,包括:
第一获取模块,用于获取汽车的全景图像;
空间布局确定模块,用于基于所述汽车的全景图像确定汽车内部空间布局信息,所述汽车内部空间布局信息包括座椅分布信息、车门信息、汽车内饰信息、其中汽车包括四个车门,每个车门中包括一个音箱;
第二获取模块,用于获取汽车内部的实时监控视频和汽车车速;
监控处理模块,用于基于所述汽车内部的实时监控视频使用监控处理模型确定司机信息、车窗的打开面积,每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述监控处理模型为门控循环单元,所述监控处理模型的输入为所述汽车内部的实时监控视频,所述监控处理模型的输出为所述司机信息、所述车窗的打开面积,所述每个音箱到司机耳朵的距离,所述司机信息包括司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度;
进风确定模块,用于基于所述汽车车速和所述车窗的打开面积确定汽车每秒的进风量;
噪音确定模块,用于基于所述汽车每秒的进风量、所述汽车内部空间布局信息和所述司机耳朵位置确定气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息;
处理模块,用于构建五个节点和四条边,所述五个节点包括司机节点和四个音箱节点,所述司机节点为中心节点,所述四个音箱节点分别与所述司机节点建立四条边,所述司机节点的节点特征包括气流传到司机耳朵时的气流噪音的频率信息、气流传到司机耳朵时的气流噪音的气流噪音的强度信息、司机耳朵位置、司机年龄、司机性别、司机体重、头发对耳朵的遮挡程度,所述音箱节点的节点特征包括音箱所在位置、音箱信息,所述四条边表示声音传播路径,所述四条边的每条边的边的特征是每个音箱到司机耳朵的距离;
音箱参数确定模块,用于基于图神经网络模型对所述五个节点和四条边进行处理确定每个音箱的音箱参数。
6.如权利要求5所述的基于人工智能和大数据分析的音箱参数确定系统,其特征在于,所述每个音箱的音箱参数包括音量、均衡器参数、低音增强、高音增强。
7.如权利要求5所述的基于人工智能和大数据分析的音箱参数确定系统,其特征在于,所述音箱信息包括音箱尺寸、音箱功率、音箱频率响应范围。
8.如权利要求5所述的基于人工智能和大数据分析的音箱参数确定系统,其特征在于,所述系统还用于:若所述气流传到司机耳朵时的气流噪音的气流噪音的强度信息大于强度阈值,则提醒司机将车窗关小。
CN202410017068.4A 2024-01-05 2024-01-05 基于人工智能和大数据分析的音箱参数确定方法和系统 Active CN117520788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410017068.4A CN117520788B (zh) 2024-01-05 2024-01-05 基于人工智能和大数据分析的音箱参数确定方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410017068.4A CN117520788B (zh) 2024-01-05 2024-01-05 基于人工智能和大数据分析的音箱参数确定方法和系统

Publications (2)

Publication Number Publication Date
CN117520788A CN117520788A (zh) 2024-02-06
CN117520788B true CN117520788B (zh) 2024-03-22

Family

ID=89764884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410017068.4A Active CN117520788B (zh) 2024-01-05 2024-01-05 基于人工智能和大数据分析的音箱参数确定方法和系统

Country Status (1)

Country Link
CN (1) CN117520788B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107848488A (zh) * 2015-08-03 2018-03-27 深圳市好航科技有限公司 多用途车辆智能监控系统及方法
DE102018000059A1 (de) * 2018-01-05 2019-07-11 Paragon Ag Beschallungsanlage für den Innenraum eines Kraftfahrzeugs
CN112017626A (zh) * 2020-08-21 2020-12-01 中车株洲电力机车有限公司 轨道交通车辆有源降噪方法及司机室
CN113320537A (zh) * 2021-07-16 2021-08-31 北京航迹科技有限公司 一种车辆控制方法和系统
CN114117196A (zh) * 2020-09-01 2022-03-01 宝马股份公司 用于在车辆内向用户提供推荐服务的方法和系统
CN114697128A (zh) * 2022-04-13 2022-07-01 石家庄汇勤网络科技有限公司 通过人工智能决策的大数据去噪方法及大数据采集系统
CN115320582A (zh) * 2022-09-22 2022-11-11 中科唯速(广东)科技有限公司 一种无人车自动识别系统
CN115497149A (zh) * 2022-10-21 2022-12-20 浙江吉利控股集团有限公司 一种汽车座舱的音乐交互方法
CN115497498A (zh) * 2021-06-17 2022-12-20 华为技术有限公司 音频处理方法、装置、系统、终端及计算机可读存储介质
CN116156048A (zh) * 2023-04-23 2023-05-23 成都苏扶软件开发有限公司 基于人工智能的音量调整方法、系统、设备和介质
CN116612458A (zh) * 2023-05-30 2023-08-18 易飒(广州)智能科技有限公司 基于深度学习的泊车路径确定方法与系统
CN116674593A (zh) * 2022-07-21 2023-09-01 百度(美国)有限责任公司 用于自主车辆的具有异常检测的安全增强规划系统
CN117234455A (zh) * 2023-11-14 2023-12-15 深圳市齐奥通信技术有限公司 基于环境感知的音频装置智能控制方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068140B2 (en) * 2016-12-02 2018-09-04 Bayerische Motoren Werke Aktiengesellschaft System and method for estimating vehicular motion based on monocular video data
DE102019217733A1 (de) * 2019-11-18 2021-05-20 Volkswagen Aktiengesellschaft Verfahren zum Betreiben eines Bediensystems in einem Fahrzeug und Bediensystem für ein Fahrzeug
US20220274625A1 (en) * 2021-02-26 2022-09-01 Zoox, Inc. Graph neural networks with vectorized object representations in autonomous vehicle systems

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107848488A (zh) * 2015-08-03 2018-03-27 深圳市好航科技有限公司 多用途车辆智能监控系统及方法
DE102018000059A1 (de) * 2018-01-05 2019-07-11 Paragon Ag Beschallungsanlage für den Innenraum eines Kraftfahrzeugs
CN112017626A (zh) * 2020-08-21 2020-12-01 中车株洲电力机车有限公司 轨道交通车辆有源降噪方法及司机室
CN114117196A (zh) * 2020-09-01 2022-03-01 宝马股份公司 用于在车辆内向用户提供推荐服务的方法和系统
CN115497498A (zh) * 2021-06-17 2022-12-20 华为技术有限公司 音频处理方法、装置、系统、终端及计算机可读存储介质
CN113320537A (zh) * 2021-07-16 2021-08-31 北京航迹科技有限公司 一种车辆控制方法和系统
CN114697128A (zh) * 2022-04-13 2022-07-01 石家庄汇勤网络科技有限公司 通过人工智能决策的大数据去噪方法及大数据采集系统
CN116674593A (zh) * 2022-07-21 2023-09-01 百度(美国)有限责任公司 用于自主车辆的具有异常检测的安全增强规划系统
CN115320582A (zh) * 2022-09-22 2022-11-11 中科唯速(广东)科技有限公司 一种无人车自动识别系统
CN115497149A (zh) * 2022-10-21 2022-12-20 浙江吉利控股集团有限公司 一种汽车座舱的音乐交互方法
CN116156048A (zh) * 2023-04-23 2023-05-23 成都苏扶软件开发有限公司 基于人工智能的音量调整方法、系统、设备和介质
CN116612458A (zh) * 2023-05-30 2023-08-18 易飒(广州)智能科技有限公司 基于深度学习的泊车路径确定方法与系统
CN117234455A (zh) * 2023-11-14 2023-12-15 深圳市齐奥通信技术有限公司 基于环境感知的音频装置智能控制方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Fuzzy Approach for In-Car Sound Quality Prediction;Judit Lukács;《Acta Polytechnica Hungarica》;20201231;第17卷(第6期);第75-94页 *
基于BP神经网络的车内噪声时变综合烦躁度评价模型;陈卉等;《噪声与振动控制》;20180630;第38卷(第3期);第55-59页 *
轨道车模拟驾驶系统的研究与实现;高兴琳;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20150315(第3期);第C033-338页 *
面向空巢老年人的智能音箱VUI设计研究;龙海容;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20210915(第9期);第C042-519页 *

Also Published As

Publication number Publication date
CN117520788A (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
CN106686520A (zh) 能跟踪用户的多声道音响系统和包括其的设备
US20200186912A1 (en) Audio headset device
US11317233B2 (en) Acoustic program, acoustic device, and acoustic system
US20220101623A1 (en) Room Acoustics Simulation Using Deep Learning Image Analysis
US20210235213A1 (en) Generating sound zones using variable span filters
CN111124108A (zh) 模型训练方法、手势控制方法、装置、介质及电子设备
CN115862657B (zh) 随噪增益方法和装置、车载系统、电子设备及存储介质
US11457325B2 (en) Dynamic time and level difference rendering for audio spatialization
US11170139B1 (en) Real-time acoustical ray tracing
CN110789478B (zh) 车载音响参数辅助调节方法、装置以及音频处理器
CN117520788B (zh) 基于人工智能和大数据分析的音箱参数确定方法和系统
CN117253472B (zh) 一种基于生成式深度神经网络的多区域声场重建控制方法
CN111948609B (zh) 基于Soft-argmax回归器的双耳声源定位方法
CN116160955B (zh) 一种车辆主动声浪增强方法、装置、存储介质及设备
KR20230123472A (ko) 공간 오디오 윈드 노이즈 검출
CN110049409B (zh) 用于全息影像的动态立体声调节方法及装置
CN113194387A (zh) 音频信号处理方法、装置、电子设备及存储介质
US20230171543A1 (en) Method and device for processing audio signal by using artificial intelligence model
KR102650763B1 (ko) 오디오 소스 지향성에 기초한 심리음향 강화
CN117896469B (zh) 音频分享方法、装置、计算机设备和存储介质
CN117278910B (zh) 音频信号的生成方法、装置、电子设备及存储介质
Al-Mafrachi et al. A Robust Acoustic Head Orientation Estimation and Speech Enhancement for In-Car Communication Systems
WO2023220918A1 (zh) 一种音频信号处理方法、装置、存储介质和车辆
Rumsey Automotive Audio Optimization, Testing, and Evaluation
Favaretto Sound Quality Evaluation of the Interior Noise of a Tractor HVAC System Based on Prediction Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240410

Address after: Room 204, Building 4, Tian'an Nanhai Digital New City, No.1 Jianping Road, Guicheng Street, Nanhai District, Foshan City, Guangdong Province, 528200

Patentee after: Flash Mutual Technology (Guangdong) Co.,Ltd.

Country or region after: China

Address before: Room 102-940, 1st Floor, Unit 1, Building 11, No. 88 Niushahou Street, Jinjiang District, Chengdu City, Sichuan Province, 610000

Patentee before: Chengdu Yadu Kesheng Technology Co.,Ltd.

Country or region before: China