CN118215186B - 一种车载氛围灯控制方法、装置、设备及存储介质 - Google Patents

一种车载氛围灯控制方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN118215186B
CN118215186B CN202410635342.4A CN202410635342A CN118215186B CN 118215186 B CN118215186 B CN 118215186B CN 202410635342 A CN202410635342 A CN 202410635342A CN 118215186 B CN118215186 B CN 118215186B
Authority
CN
China
Prior art keywords
rhythm
audio data
vehicle
data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410635342.4A
Other languages
English (en)
Other versions
CN118215186A (zh
Inventor
杨泞珲
李来生
王波
刘雪林
王城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Seres Technology Co Ltd
Original Assignee
Chengdu Seres Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Seres Technology Co Ltd filed Critical Chengdu Seres Technology Co Ltd
Priority to CN202410635342.4A priority Critical patent/CN118215186B/zh
Publication of CN118215186A publication Critical patent/CN118215186A/zh
Application granted granted Critical
Publication of CN118215186B publication Critical patent/CN118215186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/105Controlling the light source in response to determined parameters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q3/00Arrangement of lighting devices for vehicle interiors; Lighting devices specially adapted for vehicle interiors
    • B60Q3/70Arrangement of lighting devices for vehicle interiors; Lighting devices specially adapted for vehicle interiors characterised by the purpose
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q3/00Arrangement of lighting devices for vehicle interiors; Lighting devices specially adapted for vehicle interiors
    • B60Q3/80Circuits; Control arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/105Controlling the light source in response to determined parameters
    • H05B47/115Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings
    • H05B47/12Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings by detecting audible sound
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/165Controlling the light source following a pre-assigned programmed sequence; Logic control [LC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Mechanical Engineering (AREA)
  • Probability & Statistics with Applications (AREA)
  • Circuit Arrangement For Electric Light Sources In General (AREA)

Abstract

本申请提供一种车载氛围灯控制方法、装置、设备及存储介质,该方法包括:获取车辆的历史音频数据和目标音频数据,基于历史音频数据的节奏标签对历史音频数据进行标注,以生成训练样本数据集,并基于训练样本数据集对初始卷积神经网络进行训练得到音乐节奏检测模型,将目标音频数据输入音乐节奏检测模型,得到目标音频数据的节奏信息,以根据节奏信息控制车辆的氛围灯;通过构建音乐节奏检测模型,在不弱化信号特征的前提下优化输入数据,并且在输入音频时间序列数据的同时,输出对音乐节奏信号的识别结果,得到了准确直观的音乐节奏数据,实现了车载氛围灯随音乐节奏精确律动。

Description

一种车载氛围灯控制方法、装置、设备及存储介质
技术领域
本申请涉及自动控制技术领域,具体涉及一种车载氛围灯控制方法、装置、设备及存储介质。
背景技术
为了深化用户体验,高端新能源车纷纷引入氛围灯系统,力求打造车内温馨且愉悦的驾驶环境,在其中,音乐律动功能尤为关键,它使音乐与灯光完美交融,共同营造出富有动感的氛围,让驾驶者的感官体验得以升华。然而,当前市场上的氛围灯系统仍有待完善。例如,许多系统无法实现灯光与音乐节奏的精准同步,导致灯光变换与音乐节奏之间存在明显的滞后或超前,削弱了整体的沉浸感。此外,对于节拍变化复杂、节奏快速转换的音乐,现有系统往往难以精确捕捉其节奏变化,使得灯光效果无法与音乐节奏保持同步,影响了整体的观赏性和体验效果。
因此,我们需要进一步研发和优化氛围灯系统,提升其对音乐节奏的识别能力和同步精度,以打造出更加完美、沉浸式的音乐与灯光体验,让驾驶者在享受音乐的同时,也能感受到灯光带来的视觉盛宴。
发明内容
鉴于以上现有技术的缺点,本申请提供一种车载氛围灯控制方法、装置、设备及存储介质,以解决上述当前车载氛围灯的灯光效果无法与音乐节奏保持同步,影响了整体的观赏性和体验效果技术问题。
本申请提供的一种车载氛围灯控制方法,方法包括:获取车辆的历史音频数据和目标音频数据,历史音频数据为带有节奏标签的音频数据;基于历史音频数据的节奏标签对历史音频数据进行标注,以生成训练样本数据集,并基于训练样本数据集对初始卷积神经网络进行训练,得到训练后的音乐节奏检测模型,标签包括节奏点和非节奏点;将目标音频数据输入音乐节奏检测模型,得到目标音频数据的节奏信息;根据节奏信息控制车辆的氛围灯,以实现对车载氛围灯的控制。
于本申请的一实施例中,将目标音数据输入音乐节奏检测模型,得到目标音频数据的节奏信息,包括:获取初始时间序列,初始时间序列用于表征输入音乐节奏检测模型的目标音频数据;将初始时间序列分为多个序列段,并取各序列段的最大值为序列段的规范值,以基于取得的规范值生成更新时间序列;捕获更新时间序列的局部特征,基于预设激活函数对局部特征进行卷积,得到非线性特征,并对非线性特征进行残差连接,得到初始时间序列的时间特征;将时间特征输入全连接神经网络,以得到目标音频数据的节奏信息。
于本申请的一实施例中,将时间特征输入全连接神经网络,以得到目标音频数据的节奏信息,包括:计算时间特征和目标特征的重合率,目标特征用于表征标签信息为节奏点的历史音频数据的特征;若重合率高于或等于预设重合率阈值,则视为目标音频数据为节奏点的概率大于或等于预设概率阈值,即目标音频数据为强节奏;若重合率低于预设重合率阈值,则视为目标音频数据为节奏点的概率小于预设概率阈值,即目标音频数据为弱节奏。
于本申请的一实施例中,得到训练后的音乐节奏检测模型之后,还包括:获取测试音频数据,测试音频数据为带有节奏标签的音频数据;将测试音频数据输入音乐节奏检测模型,以得到测试输出结果;计算测试输出结果和测试音频实际节奏标签的差值,以得到损失值,并基于损失值构建损失函数;基于损失函数对音乐节奏检测模型的输出结果进行修正,以对音乐节奏检测模型进行优化。
于本申请的一实施例中,获取车辆的目标音频数据之前,还包括:获取原始音频数据和频率分段阈值;基于频率分段阈值对原始音频数据进行分类,以得到多个频率不同的音频组;将任一音频组的音频数据确定为目标音频数据。
于本申请的一实施例中,根据节奏信息确定目标音频数据的音乐节奏点,包括:对目标音频数据进行赋值,将节奏点赋值为第一值,将非节奏点赋值为第二值;基于预设数据容量对赋值后的目标音频数据进行分组,数据容量用于表征每个数据组总的数据量;将任一数据组确定为目标数据组,获取目标数据组中第一值的数量和第二值的数量,若第一值的数量大于或等于第二值的数量,则目标数据组的综合值判定为第一值,即目标数据组的综合节奏信息为节奏点;遍历全部数据组,以得到各数据组的节奏信息。
于本申请的一实施例中,控制车辆的氛围灯在音乐节奏点闪烁,包括:根据节奏信息转化为数字信息,并将数字信息中取值为1的点判定为节奏点;控制车辆的氛围灯在音乐节奏点闪烁。
本申请提供一种车载氛围灯控制装置,装置包括:数据采集模块,用于获取车辆的历史音频数据和目标音频数据,历史音频数据为带有节奏标签的音频数据;模型构建模块,用于基于历史音频数据的节奏标签对历史音频数据进行标注,以生成训练样本数据集,并基于训练样本数据集对初始卷积神经网络进行训练,得到训练后的音乐节奏检测模型,标签包括节奏点和非节奏点;节奏识别模块,用于将目标音频数据输入音乐节奏检测模型,得到目标音频数据的节奏信息;控制模块,用于根据节奏信息控制车辆的氛围灯,以实现对车载氛围灯的控制。
本申请提供一种电子设备,包括处理器、存储器和通信总线;通信总线用于将处理器和存储器连接;处理器用于执行存储器中存储的计算机程序,以实现上的车载氛围灯控制方法。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序用于使计算机执行如上的车载氛围灯控制方法。
本申请的有益效果:本申请中的一种车载氛围灯控制方法、装置、设备及存储介质,其方法通过获取车辆的历史音频数据和目标音频数据,基于历史音频数据的节奏标签对历史音频数据进行标注,以生成训练样本数据集,并基于训练样本数据集对初始卷积神经网络进行训练得到音乐节奏检测模型,将目标音频数据输入音乐节奏检测模型,得到目标音频数据的节奏信息,以根据节奏信息控制车辆的氛围灯;该方法提出了构建音乐节奏检测模型,该模型在维持音频信号原始特征完整性的基础上,对输入数据进行了深入优化,在模型运作过程中,音频时间序列数据被精准地输入,同时,模型能够实时解析并输出对音乐节奏信号的精确识别结果,使得无论是轻柔的旋律还是激昂的节奏,都能被准确识别,将其与车载氛围灯相结合时,即能够随着音乐的节奏变化而精确律动,为驾驶者营造出一种身临其境的音乐体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本申请的一示例性实施例示出的车载氛围灯控制方法的实施环境示意图;
图2是本申请的一示例性实施例示出的车载氛围灯控制方法的流程图;
图3是本申请的一示例性实施例示出的车载氛围灯控制方法的信号分离示意图;
图4是本申请的一示例性实施例示出的车载氛围灯控制方法的TCN-FC网络结构示意图;
图5是本申请的一示例性实施例示出的车载氛围灯控制方法的整体方案结构示意图;
图6是本申请的一示例性实施例示出的车载氛围灯控制装置的框图;
图7示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
以下将参照附图和优选实施例来说明本申请的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本申请,而不是为了限制本申请的保护范围。
在下文描述中,探讨了大量细节,以提供对本申请实施例的更透彻的解释,然而,对本领域技术人员来说,可以在没有这些具体细节的情况下实施本申请的实施例是显而易见的,在其他实施例中,以方框图的形式而不是以细节的形式来示出公知的结构和设备,以避免使本申请的实施例难以理解。
首先需要说明的是,TCN(Temporal Convolutional Network,时间卷积神经网络)是一种具有时序特性的卷积神经网络。它的设计初衷是为了使卷积神经网络能够处理时序数据,例如时间序列预测、音频合成、字符级和单词级语言建模等任务。
膨胀卷积(Dilated Convolution),也称为空洞卷积(Atrous Convolution),是卷积神经网络中的一种特殊卷积方式。它通过在卷积核的元素之间插入一些额外的空间来增大感受野,而不需要增加卷积核的参数数量或计算复杂度。
因果卷积(Causal Convolution)是一种特殊的卷积操作,主要应用于时间序列数据或具有时序性的数据分析任务。它的主要特点是确保输出只依赖于过去的输入数据,而不受未来信息的影响。
全连接神经网络(Fully Connected Neural Network)是深度学习中最为基础和简单的神经网络结构。这种网络中的每个节点都与相邻层的每一个节点相连,因此被称为全连接。这种结构使得网络能够学习并捕捉到输入数据中的复杂特征。
图1是本申请的一示例性实施例示出的车载氛围灯控制方法的实施环境示意图。
如图1所示,该车载氛围灯控制方法的实施环境包括数据采集设备101和计算机设备102,其中,数据采集设备101用于采集音频信息的初始数据,并将采集得到的音频数据发送至计算机设备102,其数据采集设备可以是任意可用于采集音频信息的设备,如声音传感器等,本申请并不对此作任何限制;计算机设备102则用于基于数据采集设备101采集得到的音频数据,根据其中带有节奏标签的音频数据构建音乐节奏检测模型,从而对没有音乐节奏的目标音频数据的节奏信息进行识别,最终基于其识别得到的节奏信息对车载氛围灯进行控制。其中,计算机设备102可以是台式图形处理器(Graphic Processing Unit,GPU)计算机、GPU计算集群、神经网络计算机等中的至少一种,也可以是集成在当前车辆上的智能处理器,本申请亦不对此做任何限制。
图2是本申请的一示例性实施例示出的车载氛围灯控制方法的流程图。
如图2所示,在一示例性的实施例中,车载氛围灯控制方法至少包括步骤S210至步骤S240,详细介绍如下:
步骤S210,获取车辆的历史音频数据和目标音频数据,历史音频数据为带有节奏标签的音频数据。
在本申请的一个实施例中,获取车辆的目标音频数据之前,还包括:获取原始音频数据和频率分段阈值;基于频率分段阈值对原始音频数据进行分类,以得到多个频率不同的音频组;将任一音频组的音频数据确定为目标音频数据。
图3是本申请的一示例性实施例示出的车载氛围灯控制方法的信号分离示意图。
如图3所示,在本申请的一个具体实施例中,采用多信道滤波的方式设计一个节奏信号分离器,并针对不同乐器的频率范围将节奏信号分离器定位9个频率通道,分为是超低频20Hz-40Hz、极低频40Hz-80Hz、低频80Hz-160Hz、中低频160Hz-320Hz、中频320Hz-640Hz、中高频640Hz-1280Hz、高频1280Hz-2560Hz、极高频2560Hz-5120Hz、超高频5120Hz-20000Hz。此外,将得到的原始音频信息输入该节奏信号分离器之后,结合快速傅里叶变换、巴特沃斯滤波器、快速傅里叶逆变换,实现对音频信号的分离,从而得到其音频信号的输出。需要说明的是,其输出的信号为原始音频信号基于频率进行分段之后的多个音频组。
步骤S220,基于历史音频数据的节奏标签对历史音频数据进行标注,以生成训练样本数据集,并基于训练样本数据集对初始卷积神经网络进行训练,得到训练后的音乐节奏检测模型,标签包括节奏点和非节奏点。
在本申请的一个实施例中,首先,从各种音乐库中收集大量的历史音频数据,这些数据涵盖了不同风格、节奏和速度的音乐,并对于收集到的每一段音频数据进行标注,其标注工作主要是识别音频中的节奏点和非节奏点,需要说明的是,节奏点通常指的是音乐中强拍或弱拍的位置,而非节奏点则是音乐中不具有明显节奏特征的部分;然后,将标注好的音频数据按照节奏点和非节奏点进行分割,并提取相应的特征(如频谱特征、时域特征等),从而将这些特征和对应的标签(节奏点或非节奏点)组合成训练样本,形成训练样本数据集;此外,还设计并构建一个初始的卷积神经网络模型,该模型具有多个卷积层、池化层和全连接层,用于从音频数据中提取特征并进行分类,使用前述生成的训练样本数据集对初始卷积神经网络进行训练,在训练过程中,可以采用交叉熵损失函数来衡量模型预测结果与真实标签之间的差异,并使用梯度下降算法来优化模型的参数,从而通过多次迭代训练,模型逐渐学习到如何从音频数据中识别出节奏点和非节奏点。需要说明的是,在训练过程中,还可以定期对模型进行评估,通过计算准确率、召回率等指标来评估模型的性能,以根据评估结果对模型进行调优,如调整网络结构、改变学习率等,以进一步提高模型的性能。
需要说明的是,通过上述训练,得到了一个能够识别音乐节奏点的音乐节奏检测模型,该模型可以应用于实际的车载氛围灯系统中,通过实时分析车内的音乐数据,识别出音乐的节奏点,并据此控制氛围灯的闪烁和变化,实现音乐与灯光的精确同步律动,提升驾驶者的音乐体验。
步骤S230,将目标音频数据输入音乐节奏检测模型,得到目标音频数据的节奏信息。
在本申请的一个实施例中,将目标音数据输入音乐节奏检测模型,得到目标音频数据的节奏信息,包括:获取初始时间序列,初始时间序列用于表征输入音乐节奏检测模型的目标音频数据;将初始时间序列分为多个序列段,并取各序列段的最大值为序列段的规范值,以基于取得的规范值生成更新时间序列;捕获更新时间序列的局部特征,基于预设激活函数对局部特征进行卷积,得到非线性特征,并对非线性特征进行残差连接,得到初始时间序列的时间特征;将时间特征输入全连接神经网络,以得到目标音频数据的节奏信息。
在本申请的一个实施例中,将时间特征输入全连接神经网络,以得到目标音频数据的节奏信息,包括:计算时间特征和目标特征的重合率,目标特征用于表征标签信息为节奏点的历史音频数据的特征;若重合率高于或等于预设重合率阈值,则视为目标音频数据为节奏点的概率大于或等于预设概率阈值,即目标音频数据为强节奏;若重合率低于预设重合率阈值,则视为目标音频数据为节奏点的概率小于预设概率阈值,即目标音频数据为弱节奏。
图4是本申请的一示例性实施例示出的车载氛围灯控制方法的TCN-FC网络结构示意图。
如图4所示,将信号(即目标音频数据)输入TCN-FC网络之后,首先取其移动分段的最值,而后进入第一个残差块对其进行膨胀卷积、激活,以及正则化处理, 待经过多个残差块(本实施例以3个残差块为例)处理之后,将最后一个残差块的输出结果作为输入,将其输入至全连接神经网络中,并经过全连接神经网络的隐藏层及输出层的激活函数和损失函数处理,得到目标音频数据的节奏概率。
在本申请的一个具体实施例中,将目标音频数据生成的初始时间序列为例。首先将该初始时间序列输入神经网络中,并在其后接一个移动分段最值函数,以在不弱化信号特征的前提下减少输入数据量,设每一段长度为,信号点总数为,则计算得到每个点的信号值表示如下:
式(1)
其中,x()表示一个序列的值,max()表示取最大值。
然后,经过上述移动分段最值函数的计算,将原始信号转化为了新的时间序列,并基于新输入的时间序列信号,构建时间卷积神经网络来捕捉序列的局部特征和时序模式,在本实施例中,其时间卷积神经网络的构建采用因果膨胀卷积,其因果膨胀卷积的表示如下:
式(2)
其中,F代表大小为I的卷积核X代表时间序列d为膨胀系数。
需要说明的是,因果膨胀卷积考虑了时间信号的因果性质,即信号的输出只取决于过去的输入,而不受未来输入的影响;同时扩大了感受野,可以更好地捕捉数据中的长期依赖关系。
再然后,对上述膨胀卷积的输出采用线性修正单元进行非线性映射。此外,为了防止过拟合,引入Dropout正则化,以通过训练过程中随机将部分神经元输出置为0来降低网络复杂度,增强模型鲁棒性和泛化能力,并在卷积层之间采用残差连接,其连接方式可以表示为:
式(3)
其中,Output表示输出结果,表示将F(x)的输出与原始输入x相加的操作 。
需要说明的是,通过残差连接,可以更容易传递长期依赖的信息,帮助网络更好地对时间序列的复杂关系进行建模,在本实施例中,整个时间卷积模块三个残差块构成,并将其计算结果输入至全连接神经网络,其全连接神经网络的结构为三层, 其中,隐藏层的激活函数表示为:
式(4)
其中,代表神经元的输入或加权和,而ReLU则是激活函数对该输入的处理结果,也就是神经元的输出或激活值。
输出层的激活函数表示为:
式(5)
其中,x代表神经元的输入或加权和,e是自然对数的底数,而Sigmoid()则是激活函数对输入x的处理结果,即神经元的输出或激活值。
输出层的损失函数表示为:
式(6)
其中,是模型预测样本为强节奏信号的概率,为样本标签。
再然后,将分好对应标签的数据(即标注好节奏点和非节奏点的历史音频数据)输入模型,并在前向传播中通过计算模型实际输出与真实标签的差异,再在反向传播中根据梯度下降算法,从而利用损失函数的梯度来调整模型参数,不断最小化损失函数,达到对模型的训练,该训练后的神经网络(即神经网络)可以实现对音频信号的分类,识别出强节奏信号。
最后,将待识别节奏信号的目标音频信息输入上述得到的神经网络(即训练后的音乐节奏检测模型)中,以得到该目标音频数据的节奏信息,从而基于其节奏信息对车载氛围灯的闪烁状态进行控制。
在本申请的一个实施例中,得到训练后的音乐节奏检测模型之后,还包括:获取测试音频数据,测试音频数据为带有节奏标签的音频数据;将测试音频数据输入音乐节奏检测模型,以得到测试输出结果;计算测试输出结果和测试音频实际节奏标签的差值,以得到损失值,并基于损失值构建损失函数;基于损失函数对音乐节奏检测模型的输出结果进行修正,以对音乐节奏检测模型进行优化。
在本申请的一个实施例中,为了对音乐节奏检测模型进行优化,首先需要获取带有节奏标签的音频数据作为测试数据集,这些数据可以从音乐数据库中获取,或从公开的音乐节奏标注数据集中选择,确保测试音频数据具有多样性,涵盖不同的音乐类型、节奏风格和复杂度,以便全面评估模型的性能;然后,将获取的测试音频数据输入到已经训练好的音乐节奏检测模型中,模型会对音频数据进行处理,提取特征,并输出对音频节奏的预测结果,这些预测结果可以是节奏类型的分类标签,也可以是节奏强度的连续值;再然后,将模型输出的预测结果与测试音频数据的实际节奏标签进行比较,计算它们之间的差值,这个差值可以是分类任务中的准确率、召回率或F1分数等指标,也可以是回归任务中的均方误差(MSE)或平均绝对误差(MAE)等,根据具体的任务需求选择合适的评价指标,并基于这些指标构建损失函数;最后,利用计算得到的损失值,通过反向传播算法对模型进行优化。在优化过程中,不断调整模型的参数,以最小化损失函数,其过程可以通过梯度下降等优化算法实现。需要说明的是,经过多次迭代训练之后,模型的性能会逐渐提升,对音乐节奏的检测能力也会得到增强。
步骤S240,根据节奏信息控制车辆的氛围灯,以实现对车载氛围灯的控制。
在本申请的一个实施例中,根据节奏信息确定目标音频数据的音乐节奏点,包括:对目标音频数据进行赋值,将节奏点赋值为第一值,将非节奏点赋值为第二值;基于预设数据容量对赋值后的目标音频数据进行分组,数据容量用于表征每个数据组总的数据量;将任一数据组确定为目标数据组,获取目标数据组中第一值的数量和第二值的数量,若第一值的数量大于或等于第二值的数量,则目标数据组的综合值判定为第一值,即目标数据组的综合节奏信息为节奏点;遍历全部数据组,以得到各数据组的节奏信息。
在本申请的一个实施例中,首先,获取经过筛选和预处理的目标音频数据,并设定一个第一值(例如1),代表节奏点;一个第二值(例如0),代表非节奏点,从而根据音频数据中每个时间点是否属于节奏点,将其赋值为相应的值;然后,预设数据容量是一个固定的数值以确定每个数据组应包含的数据量,并按照预设数据容量,对赋值后的目标音频数据进行分组,就可以将整个音频数据切分成了多个数据组,且每个数据组包含相同数量的数据点;接下来,统计每一个数据组中第一值(节奏点)的数量和第二值(非节奏点)的数量;此外,还可以设定一个判定规则来确定数据组的综合节奏信息,在本实施例中,如果数据组中第一值的数量大于或等于第二值的数量,我们则将该数据组的综合值判定为第一值,即认为该数据组的综合节奏信息为节奏点;最后,按照上述步骤确定每个数据组的综合节奏信息以得到了一个包含各数据组节奏信息的列表或数组。需要说明的是,上述实施例中的数据容量可以根据实际需要进行调整,以平衡计算的效率和精度。
在本申请的一个实施例中,制车辆的氛围灯在音乐节奏点闪烁,包括:根据节奏信息转化为数字信息,并将数字信息中取值为1的点判定为节奏点;控制车辆的氛围灯在音乐节奏点闪烁。
在本申请的一个具体实施例中,首先,通过上述实施例的方法从目标音频数据中提取出节奏信息,这些节奏信息通常以二进制的形式表示,其中1代表节奏点,0代表非节奏点;然后将这些二进制节奏信息进一步转化为数字信息,这个过程可以很简单,因为二进制本身就是数字的一种形式,每个数据点的值(1或0)直接对应数字信息中的一个数值;接下来,在数字信息中,我们遍历所有数值,并将取值为1的点判定为节奏点,这些节奏点代表音乐中的强拍或重要节奏位置;再然后,将提取出的节奏点与车辆氛围灯的控制系统相连通,当系统检测到音乐中的节奏点时,发送一个信号给氛围灯的控制系统;氛围灯的控制系统则在接收到信号后在相应的节奏点触发氛围灯的闪烁,这种闪烁可以是单色的、渐变的或是彩色的,根据车辆和氛围灯系统的具体配置而定。此外,为了增强用户体验,氛围灯的闪烁模式和强度还可以根据音乐的节奏强度、速度等特性进行调整。例如,节奏强烈时,氛围灯可以闪烁得更亮、更快;节奏柔和时,则可以闪烁得更柔和、更慢。
需要说明的是,在本申请提出的车载氛围灯控制方法中,通过分析不同乐器的频率范围,设计了节奏信号分类器,可以有效将音乐中节奏规律明显的音频信号分离出来;还针对音乐节奏的识别和分类设计了神经网络,从而可以在不弱化信号特征的前提下优化输入数据,并且在输入音频时间序列数据的同时,输出对音乐节奏信号分类的概率值,实现识别强节奏信号的功能;此外,还设计了阈值函数和类平均池化组合的音频信号处理方法,然后将数字信号通过Lin转换器转化为Lin信号发送给氛围灯控制器,在不降低采样率,保证音频信号不失真的情况下,得到了准确直观的音乐节奏数据,实现了音乐随节奏精确律动。
图5是本申请的一示例性实施例示出的车载氛围灯控制方法的整体方案结构示意图。
在本申请的一个实施例中,如图5所示,首先读取音频文件(及原始音频数据)得到原始信号,然后基于节奏信号分离器对其进行音频信号分离,以得到多个不同频率的音频组,将分离后的音频组视为目标音频数据,将其输入至神经网络中,以得到其中的强节奏信号和杂乱信号,从而基于其强节奏信号基于阈值函数处理,得到多组节奏信号(如节奏信号1和节奏信号2),然后将得到的多组节奏信号通过类平均池化处理,并进一步将处理后的信号通过LIN转换,得到数字信号,以将其数字信号发送给氛围灯控制器,从而触发氛围灯控制器基于接收到的数字信号控制氛围灯随音乐节奏闪烁。
最后,还需要说明的是,在本申请提出的车载氛围灯控制方法中,通过深入探究不同乐器的频率范围特性,设计了节奏信号分类器,该分类器能够精准地辨识音乐中那些节奏规律鲜明、易于捕捉的音频信号,并将其从复杂的音乐混合体中有效分离出来;为了进一步提升音乐节奏识别的精度和效率,进一步设计了神经网络,以针对音乐节奏的识别和分类进行深度优化,能够在不损害信号特征完整性的前提下,对输入数据进行智能优化处理,并在接收音频时间序列数据的同时,基于神经网络能够输出对音乐节奏信号分类的概率值,从而实现对强节奏信号的精准识别;此外,还将经过处理的数字信号通过Lin转换器转化为Lin信号,然后发送给氛围灯控制器,这一过程中,我们严格保证了采样率不降低,音频信号不失真,从而得到了准确且直观的音乐节奏数据;最终,通过成功实现了音乐随节奏精确律动的功能,不仅为驾驶者带来了更加沉浸式的音乐体验,更为车载娱乐系统的发展注入了新的活力,不仅提升了音乐节奏识别的精度和效率,更为车载氛围灯系统的智能化发展开辟了新的道路。
图6是本申请的一示例性实施例示出的车载氛围灯控制装置的框图。该装置可以应用于图1所示的实施环境中。该装置也可以适用于其它的示例性实施环境,并具体配置在其它设备中,本实施例不对该装置所适用的实施环境进行限制。
如图6所示,该示例性的车载氛围灯控制装置包括:数据采集模块610,模型构建模块620,节奏识别模块630,以及控制模块640。
数据采集模块610,用于获取车辆的历史音频数据和目标音频数据,历史音频数据为带有节奏标签的音频数据;模型构建模块620,用于基于历史音频数据的节奏标签对历史音频数据进行标注,以生成训练样本数据集,并基于训练样本数据集对初始卷积神经网络进行训练,得到训练后的音乐节奏检测模型,标签包括节奏点和非节奏点;节奏识别模块630,用于将目标音频数据输入音乐节奏检测模型,得到目标音频数据的节奏信息;控制模块640,用于根据节奏信息控制车辆的氛围灯,以实现对车载氛围灯的控制。
需要说明的是,上述实施例所提供的车载氛围灯控制装置与上述实施例所提供的车载氛围灯控制方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。上述实施例所提供的车载氛围灯控制装置在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能,本处也不对此进行限制。
本申请的实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得电子设备实现上述各个实施例中提供的车载氛围灯控制方法。
图7示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图7示出的电子设备的计算机系统700仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元701,其可以根据存储在只读存储器702中的程序或者从储存部分708加载到随机访问存储器703中的程序执行各种适当的动作和处理,例如执行上述实施例中的方法。在随机访问存储器703中,还存储有系统操作所需的各种程序和数据。中央处理单元701、只读存储器702以及随机访问存储器703通过总线704彼此相连。输入/输出接口705也连接至总线704。
以下部件连接至输入/输出接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分707;包括硬盘等的储存部分708;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至输入/输出接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入储存部分708。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元701执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合。在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框,以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机的处理器执行时,使计算机执行如前的车载氛围灯控制方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的车载氛围灯控制方法。
上述实施例仅示例性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,但凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。

Claims (8)

1.一种车载氛围灯控制方法,其特征在于,所述方法包括:
获取车辆的历史音频数据和目标音频数据,所述历史音频数据为带有节奏标签的音频数据;
基于所述历史音频数据的节奏标签对所述历史音频数据进行标注,以生成训练样本数据集,并基于所述训练样本数据集对初始卷积神经网络进行训练,得到训练后的音乐节奏检测模型,所述标签包括节奏点和非节奏点;
将所述目标音频数据输入所述音乐节奏检测模型,得到所述目标音频数据的节奏信息,包括:获取初始时间序列,所述初始时间序列用于表征输入所述音乐节奏检测模型的目标音频数据;将所述初始时间序列分为多个序列段,并取各序列段的最大值为所述序列段的规范值,以基于取得的规范值生成更新时间序列;捕获所述更新时间序列的局部特征,基于预设激活函数对所述局部特征进行卷积,得到非线性特征,并对所述非线性特征进行残差连接,得到所述初始时间序列的时间特征;计算所述时间特征和目标特征的重合率,所述目标特征用于表征标签信息为节奏点的历史音频数据的特征;若所述重合率高于或等于预设重合率阈值,则视为所述目标音频数据为节奏点的概率大于或等于预设概率阈值,即所述目标音频数据为强节奏;若所述重合率低于预设重合率阈值,则视为所述目标音频数据为节奏点的概率小于预设概率阈值,即所述目标音频数据为弱节奏;
根据所述节奏信息控制所述车辆的氛围灯,以实现对车载氛围灯的控制。
2.根据权利要求1所述的车载氛围灯控制方法,其特征在于,得到训练后的音乐节奏检测模型之后,还包括:
获取测试音频数据,所述测试音频数据为带有节奏标签的音频数据;
将所述测试音频数据输入所述乐节奏检测模型,以得到测试输出结果;
计算所述测试输出结果和所述测试音频实际节奏标签的差值,以得到损失值,并基于所述损失值构建损失函数;
基于所述损失函数对所述音乐节奏检测模型的输出结果进行修正,以对所述音乐节奏检测模型进行优化。
3.根据权利要求1所述的车载氛围灯控制方法,其特征在于,获取车辆的目标音频数据之前,还包括:
获取原始音频数据和频率分段阈值;
基于所述频率分段阈值对所述原始音频数据进行分类,以得到多个频率不同的音频组;
将任一音频组的音频数据确定为目标音频数据。
4.根据权利要求1所述的车载氛围灯控制方法,其特征在于,根据所述节奏信息确定所述目标音频数据的音乐节奏点,包括:
对所述目标音频数据进行赋值,将节奏点赋值为第一值,将非节奏点赋值为第二值;
基于预设数据容量对所述赋值后的目标音频数据进行分组,所述数据容量用于表征每个数据组合的数据量;
将任一数据组确定为目标数据组,获取所述目标数据组中第一值的数量和第二值的数量,若所述第一值的数量大于或等于所述第二值的数量,则所述目标数据组的综合值判定为第一值,即所述目标数据组的综合节奏信息为节奏点;
遍历全部数据组,以得到各数据组的节奏信息。
5.根据权利要求1-4任一项所述的车载氛围灯控制方法,其特征在于,控制所述车辆的氛围灯在所述音乐节奏点闪烁,包括:
根据所述节奏信息转化为数字信息,并将所述数字信息中取值为1的点判定为节奏点;
控制所述车辆的氛围灯在所述音乐节奏点闪烁。
6.一种车载氛围灯控制装置,其特征在于,所述装置包括:
数据采集模块,用于获取车辆的历史音频数据和目标音频数据,所述历史音频数据为带有节奏标签的音频数据;
模型构建模块,用于基于所述历史音频数据的节奏标签对所述历史音频数据进行标注,以生成训练样本数据集,并基于所述训练样本数据集对初始卷积神经网络进行训练,得到训练后的音乐节奏检测模型,所述标签包括节奏点和非节奏点;
节奏识别模块,用于将所述目标音频数据输入所述音乐节奏检测模型,得到所述目标音频数据的节奏信息,包括,将初始时间序列分为多个序列段,并取各序列段的最大值为所述序列段的规范值,以基于取得的规范值生成更新时间序列;捕获所述更新时间序列的局部特征,基于预设激活函数对所述局部特征进行卷积,得到非线性特征,并对所述非线性特征进行残差连接,得到所述初始时间序列的时间特征;计算所述时间特征和目标特征的重合率,所述目标特征用于表征标签信息为节奏点的历史音频数据的特征;若所述重合率高于或等于预设重合率阈值,则视为所述目标音频数据为节奏点的概率大于或等于预设概率阈值,即所述目标音频数据为强节奏;若所述重合率低于预设重合率阈值,则视为所述目标音频数据为节奏点的概率小于预设概率阈值,即所述目标音频数据为弱节奏;
控制模块,用于根据所述节奏信息控制所述车辆的氛围灯,以实现对车载氛围灯的控制。
7.一种电子设备,其特征在于,包括处理器、存储器和通信总线;所述通信总线用于将所述处理器和存储器连接;所述处理器用于执行所述存储器中存储的计算机程序,以实现如权利要求1-5任一项所述的车载氛围灯控制方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序用于使计算机执行如权利要求1-5任一项所述的车载氛围灯控制方法。
CN202410635342.4A 2024-05-22 2024-05-22 一种车载氛围灯控制方法、装置、设备及存储介质 Active CN118215186B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410635342.4A CN118215186B (zh) 2024-05-22 2024-05-22 一种车载氛围灯控制方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410635342.4A CN118215186B (zh) 2024-05-22 2024-05-22 一种车载氛围灯控制方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN118215186A CN118215186A (zh) 2024-06-18
CN118215186B true CN118215186B (zh) 2024-07-19

Family

ID=91449327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410635342.4A Active CN118215186B (zh) 2024-05-22 2024-05-22 一种车载氛围灯控制方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN118215186B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111773A (zh) * 2019-04-01 2019-08-09 华南理工大学 基于卷积神经网络的音乐信号多乐器识别方法
CN111048111A (zh) * 2019-12-25 2020-04-21 广州酷狗计算机科技有限公司 检测音频的节奏点的方法、装置、设备及可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111128100B (zh) * 2019-12-20 2021-04-20 网易(杭州)网络有限公司 节奏点检测方法、装置及电子设备
CN114684013A (zh) * 2022-03-31 2022-07-01 东风汽车集团股份有限公司 车内氛围灯智能调节系统及控制方法
CN116189705A (zh) * 2022-09-07 2023-05-30 深圳市千岩科技有限公司 音频节奏点提取方法、基于节奏点的控制方法及电子装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111773A (zh) * 2019-04-01 2019-08-09 华南理工大学 基于卷积神经网络的音乐信号多乐器识别方法
CN111048111A (zh) * 2019-12-25 2020-04-21 广州酷狗计算机科技有限公司 检测音频的节奏点的方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN118215186A (zh) 2024-06-18

Similar Documents

Publication Publication Date Title
CN109583501B (zh) 图片分类、分类识别模型的生成方法、装置、设备及介质
CN111627458B (zh) 一种声源分离方法及设备
CN110503192A (zh) 资源有效的神经架构
US20210158166A1 (en) Semi-structured learned threshold pruning for deep neural networks
CN112101544A (zh) 适用于长尾分布数据集的神经网络的训练方法和装置
CN111444967A (zh) 生成对抗网络的训练方法、生成方法、装置、设备及介质
CN113813609B (zh) 游戏音乐风格分类方法、装置、可读介质及电子设备
US20220121949A1 (en) Personalized neural network pruning
US20210182684A1 (en) Depth-first deep convolutional neural network inference
CN113241092A (zh) 基于双注意力机制和多阶段混合卷积网络声源分离方法
CN113870863B (zh) 声纹识别方法及装置、存储介质及电子设备
Wen et al. Parallel attention of representation global time–frequency correlation for music genre classification
Kumar et al. A comparative study on deep learning techniques for bird species recognition
CN118215186B (zh) 一种车载氛围灯控制方法、装置、设备及存储介质
Singh Speech emotion recognition using enhanced cat swarm optimization algorithm
CN111026908A (zh) 歌曲标签确定方法、装置、计算机设备以及存储介质
CN116186323A (zh) 音频匹配方法、装置、设备及存储介质
CN115810129A (zh) 一种基于轻量化网络的物体分类方法
Song et al. Transfer learning for music genre classification
US20220284260A1 (en) Variable quantization for neural networks
CN114582360A (zh) 音频敏感内容的识别方法、设备和计算机程序产品
CN114722236A (zh) 音频推荐模型的训练方法及装置、介质及设备
CN107492384B (zh) 一种基于模糊最近邻算法的语音情感识别方法
US11978473B1 (en) Audio classification system
CN115641879B (zh) 音乐标签获取模型训练方法、音乐标签获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant