CN117041858B

CN117041858B - 空间音频播放优化方法和装置

Info

Publication number: CN117041858B
Application number: CN202311021309.4A
Authority: CN
Inventors: 郭晓; 李向荣; 吕亚东; 刘杨; 郑强
Original assignee: Yangguang Yunting Cultural Media Co ltd
Current assignee: Yangguang Yunting Cultural Media Co ltd
Priority date: 2023-08-14
Filing date: 2023-08-14
Publication date: 2024-04-09
Anticipated expiration: 2043-08-14
Also published as: CN117041858A

Abstract

本公开提供了一种空间音频播放优化方法和装置，所述空间音频播放优化方法包括：获取预训练的强化学习模型输出的车载音响的初始播放参数；控制车载音响按照初始播放参数解码播放预设空间音频，其中，预设空间音频关联有音频指标参考值；获取在车内预设位置录制的车载音响所播放的音频，作为录制空间音频；检测录制空间音频的音频指标，得到音频指标检测值；根据音频指标参考值和音频指标检测值，确定强化信号，其中，强化信号为奖励信号或惩罚信号；将强化信号反馈至预训练的强化学习模型，以供预训练的强化学习模型确定调整播放参数；控制车载音响按照调整播放参数对空间音频进行解码播放。该方法能够大幅优化车内播放空间音频的音效。

Description

空间音频播放优化方法和装置

技术领域

本公开总体说来涉及空间音频领域，更具体地讲，涉及一种空间音频播放优化方法和空间音频播放优化装置。

背景技术

车载音响系统虽然是汽车的辅助设备，但由于车内天然形成封闭空间，许多用户都偏好在车内收听音乐。同时，不同车型内部空间及扬声器的分布有所不同，在收听空间音频时，常常难以达到最佳音效。

为了提升车内收听音效，相关技术中存在通过理论计算来修正扬声器的播放参数的方案，例如基于各个扬声器播放的音频到达预定位置的相对延迟，调节各个扬声器的输出延时，以使得各个扬声器相对于预定位置同步发声。然而实际播放过程中影响音效的因素众多，理论计算往往无法复刻实际情况，导致车内音效的提升效果受到限制。

发明内容

本公开提供一种空间音频播放优化方法和空间音频播放优化装置，用于至少解决上述问题，也可不解决上述问题。

根据本公开的一方面，提供一种空间音频播放优化方法，所述方法包括：获取预训练的强化学习模型输出的车载音响的初始播放参数；控制所述车载音响按照所述初始播放参数解码播放预设空间音频，其中，所述预设空间音频关联有音频指标参考值；获取在车内预设位置录制的所述车载音响所播放的音频，作为录制空间音频；检测所述录制空间音频的音频指标，得到音频指标检测值；根据所述音频指标参考值和所述音频指标检测值，确定强化信号，其中，所述强化信号为奖励信号或惩罚信号；将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数；控制所述车载音响按照所述调整播放参数对空间音频进行解码播放。

可选地，所述预训练的强化学习模型包括针对多个型号的车辆分别进行预训练得到的强化学习模型，其中，所述获取预训练的强化学习模型输出的车载音响的初始播放参数，包括：从所述多个型号中确定一个待优化的型号；获取所述预训练的强化学习模型针对所述待优化的型号输出的所述车载音响的所述初始播放参数。

可选地，所述根据所述音频指标参考值和所述音频指标检测值，确定强化信号，包括：在所述音频指标的数量为一个的情况下，确定所述音频指标参考值相对于所述音频指标检测值的偏差值，作为音质偏差，根据所述音质偏差与第一预设值的大小关系，确定所述强化信号；在所述音频指标的数量为至少两个的情况下，分别确定各个音频指标的所述音质偏差的统计值，作为统计偏差，根据所述统计偏差与第二预设值的大小关系，确定所述强化信号。

可选地，在所述将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数之后，所述方法还包括：在不满足结束条件的情况下，将最近一次确定的调整播放参数作为新的初始播放参数，重复执行所述控制所述车载音响按照所述初始播放参数解码播放预设空间音频的步骤至所述将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数的步骤，直到满足所述结束条件。

可选地，所述预设空间音频的数量为多个，一个预设空间音频播放一次；所述结束条件包括以下至少一个：全部预设空间音频均已被播放、所述音频指标参考值相对于所述音频指标检测值的偏差值小于第三预设值。

可选地，多个预设空间音频包括由一个原始空间音频裁剪所得的多个空间音频时序片段。

可选地，所述初始播放参数及所述预设空间音频均与音频类型相关联，并随音频类型的不同而不同。

可选地，所述预训练的强化学习模型包括针对多个车内预设位置分别进行预训练得到的强化学习模型，其中，所述获取预训练的强化学习模型输出的车载音响的初始播放参数，包括：从所述多个车内预设位置中确定一个待优化的车内预设位置；获取所述预训练的强化学习模型针对所述待优化的车内预设位置输出的所述车载音响的所述初始播放参数。

可选地，所述待优化的车内预设位置根据以下至少一个信息确定：用户输入信息、优先级信息、传感器检测信号，其中，所述传感器检测信号是表示所述多个车内预设位置分别是否有乘客的信号。

可选地，所述获取预训练的强化学习模型输出的车载音响的初始播放参数，包括：在满足优化条件的情况下，获取所述预训练的强化学习模型输出的所述车载音响的所述初始播放参数，其中，所述优化条件包括以下至少一个：车辆首次播放空间音频、所述车载音响开机、达到设定优化周期、接收到用户输入的启动指令。

可选地，所述初始播放参数和所述调整播放参数均包括以下至少一个：延时、响度、滤波特性；和/或所述音频指标包括以下至少一个：平均响度、最大峰值电平、动态范围、各声道时延、频谱分量。

根据本公开的另一方面，提供一种空间音频播放优化装置，所述装置包括：获取单元，被配置为获取预训练的强化学习模型输出的车载音响的初始播放参数；播放单元，被配置为控制所述车载音响按照所述初始播放参数解码播放预设空间音频，其中，所述预设空间音频关联有音频指标参考值；录制单元，被配置为获取在车内预设位置录制的所述车载音响所播放的音频，作为录制空间音频；检测单元，被配置为检测所述录制空间音频的音频指标，得到音频指标检测值；确定单元，被配置为根据所述音频指标参考值和所述音频指标检测值，确定强化信号，其中，所述强化信号为奖励信号或惩罚信号；调整单元，被配置为将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数；所述播放单元还被配置为控制所述车载音响按照所述调整播放参数对空间音频进行解码播放。

可选地，所述预训练的强化学习模型包括针对多个型号的车辆分别进行预训练得到的强化学习模型，所述获取单元还被配置为：从所述多个型号中确定一个待优化的型号；获取所述预训练的强化学习模型针对所述待优化的型号输出的所述车载音响的所述初始播放参数。

可选地，所述确定单元还被配置为：在所述音频指标的数量为一个的情况下，确定所述音频指标参考值相对于所述音频指标检测值的偏差值，作为音质偏差，根据所述音质偏差与第一预设值的大小关系，确定所述强化信号；在所述音频指标的数量为至少两个的情况下，分别确定各个音频指标的所述音质偏差的统计值，作为统计偏差，根据所述统计偏差与第二预设值的大小关系，确定所述强化信号。

可选地，所述装置还包括更新单元，被配置为在不满足结束条件的情况下，将最近一次确定的调整播放参数作为新的初始播放参数，重复运行所述播放单元、所述录制单元、所述检测单元、所述确定单元、所述调整单元，直到满足所述结束条件。

可选地，所述预训练的强化学习模型包括针对多个车内预设位置分别进行预训练得到的强化学习模型，所述获取单元还被配置为：从所述多个车内预设位置中确定一个待优化的车内预设位置；获取所述预训练的强化学习模型针对所述待优化的车内预设位置输出的所述车载音响的所述初始播放参数。

可选地，所述获取单元还被配置为：在满足优化条件的情况下，获取所述预训练的强化学习模型输出的所述车载音响的所述初始播放参数，其中，所述优化条件包括以下至少一个：车辆首次播放空间音频、所述车载音响开机、达到设定优化周期、接收到用户输入的启动指令。

根据本公开的另一方面，提供一种存储指令的计算机可读存储介质，其中，当所述指令被至少一个计算装置运行时，促使所述至少一个计算装置执行如上所述的空间音频播放优化方法。

根据本公开的另一方面，提供一种包括至少一个计算装置和至少一个存储指令的存储装置的系统，其中，所述指令在被所述至少一个计算装置运行时，促使所述至少一个计算装置执行如上所述的空间音频播放优化方法。

根据本公开示例性实施例的空间音频播放优化方法和空间音频播放优化装置，通过对比预设空间音频的音频指标参考值和音频指标检测值，能够对空间音频音效做出评价，得到强化信号。在此基础上，结合强化信号供预训练的强化学习模型调整播放参数，能够通过“试错”的方式实现播放参数的充分调整，打破了理论计算播放参数存在的优化效果限制，大幅优化车内播放空间音频的音效。

将在接下来的描述中部分阐述本公开总体构思另外的方面和/或优点，还有一部分通过描述将是清楚的，或者可以经过本公开总体构思的实施而得知。

附图说明

通过结合附图，从实施例的下面描述中，本公开这些和/或其它方面及优点将会变得清楚，并且更易于理解，其中：

图1是示出根据本公开示例性实施例的空间音频播放优化方法的流程图；

图2是示出根据本公开示例性实施例的空间音频播放优化装置的框图。

具体实施方式

提供参照附图的以下描述以帮助对由权利要求及其等同物限定的本发明的实施例的全面理解。包括各种特定细节以帮助理解，但这些细节仅被视为是示例性的。因此，本领域的普通技术人员将认识到在不脱离本发明的范围和精神的情况下，可对描述于此的实施例进行各种改变和修改。此外，为了清楚和简洁，省略对公知的功能和结构的描述。

在此需要说明的是，在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况：(1)包括A；(2)包括B；(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”，即表示如下三种并列的情况：(1)执行步骤一；(2)执行步骤二；(3)执行步骤一和步骤二。

空间音频是指经过精心设计的具有3D质量的音频，与传统立体声相比，它能够提供更强的深度、宽度甚至高度感。空间音频的播放需要具备支持空间音频技术(例如三维菁彩声(Audio Vivid)技术)的音频格式、硬件(例如解码器、渲染器)、软件。支持空间音频技术的格式例如有杜比全景声(Dolby Atmos)、临境音(DTS:X)，这些格式的音频是采用基于声音对象的录制技术录制得到的。支持空间音频技术的软件则利用算法模拟出多个方位的声道，使得播放出的音频不仅仅停留在平面，而是从上下左右前后构建出一个虚拟的立体空间，从而带来极强的空间立体感。

目前，空间音频技术主要应用于耳机，在车载音响系统中的应用还较少。与直接佩戴在听众耳朵上的耳机不同，车载音响系统的扬声器远离人耳且位置固定，并且不同车辆内部的空间及扬声器的分布有所不同，导致在车内收听空间音频时，常常难以达到最佳音效。

根据本公开示例性实施例的空间音频播放优化方法和空间音频播放优化装置，通过对比预设空间音频的音频指标参考值和音频指标检测值，能够对空间音频的播放音效做出评价，得到强化信号。在此基础上，结合强化信号供预训练的强化学习模型输出调整播放参数，能够通过“试错”的方式实现播放参数的充分调整，大幅优化车内播放空间音频的音效。

下面参照图1和图2详细描述根据本公开示例性实施例的空间音频播放优化方法和空间音频播放优化装置。

图1是示出根据本公开示例性实施例的空间音频播放优化方法的流程图。根据本公开示例性实施例的空间音频播放优化方法可以在具有足够运算能力的计算装置中实现。该计算装置可以是车载音响系统的主机，使得车载音响系统自身具备优化空间音频播放音效的能力。该计算装置也可以是独立于车载音响系统的第三方装置，从而能够在不改变原有车载音响系统的情况下，优化空间音频的播放音效，此时该第三方计算装置可与车辆连接，例如该第三方计算装置是安装在车内的设备，经车辆总线与车载音响系统通信，又如该第三方计算装置是智能手机等移动终端，通过蓝牙连接的方式与车载音响系统通信，从而实现该第三方计算装置对车载音响系统的控制。应理解，车载音响除了播放用户下载的离线音频(可以是普通音频，也可以是空间音频)外，也可以连接车载广播，以播放无线广播音频；在车辆配置了支持互联网连接的设备(如智能手机连接功能或内置Wi-Fi)、并且具备相应的应用程序或功能的情况下，还可以通过连接互联网来收听网络广播。

作为示例，第三方计算装置为智能手机，智能手机与车辆以有线连接(例如数据线连接)或无线连接(例如蓝牙连接)的方式连接，使得车辆连接互联网，从而令车载音响系统播放经网络广播接收的空间音频，同时智能手机执行本公开示例性实施例的空间音频播放优化方法来优化空间音频的播放音效。

参照图1，在步骤S101中，获取预训练的强化学习模型输出的车载音响的初始播放参数。

可选地，预训练的强化学习模型是借助空间音频样本及其关联的音频指标样本值，通过循环执行强化学习训练得到的模型。每次训练控制样车的车载音响播放一次空间音频样本、检测播放中的音频指标实测值、对比音频指标实测值和音频指标样本值以确定强化信号、根据强化信号重新输出播放参数，在多次训练至满足收敛条件后，就完成预训练，并将最后一次输出的播放参数作为步骤S101中的初始播放参数。其中，循环训练的过程中每次播放的可以是同一个空间音频样本，也可以是每次播放不同的空间音频样本，还可以准备多个空间音频样本，每个空间音频样本播放多次；收敛条件可以是循环训练的次数达到设定次数，也可以是音频指标实测值相对于音频指标样本值的偏差值小于预设值，本公开对此不作限制。换言之，预训练是在样车上提前统一进行的，可由应用开发者执行，从步骤S101开始，则是正式在具体的车辆上对预训练的强化学习模型加以利用，可由车主执行，以进一步调整初始播放参数，提升在具体车辆播放空间音频的音效。

可选地，初始播放参数以及下文步骤S106的调整播放参数，均包括以下至少一个：延时、响度、滤波特性。其中，延时是对音频进行延迟播放，控制不同声道的播放延时，以令不同声道的声音尽量同时到达聆听位置(即下文步骤S103的车内预设位置)；响度反映声音的强弱，控制不同声道的响度能够令不同声道产生响度差异，从而营造出声源的远近感受，提升空间感；滤波特性反映对音频信号中不同频率的成分的过滤，适宜的滤波特性能够对主要频率成分和无关频率成分加以区分筛选，从而减少无关频率成分的干扰，提升音效。通过对以上播放参数进行调整，有助于提升空间音频的播放音效。

在步骤S102中，控制车载音响按照初始播放参数解码播放预设空间音频，其中，预设空间音频关联有音频指标参考值。预设空间音频的作用与预训练时使用的空间音频样本类似，相应地，音频指标参考值和下文步骤S104的音频指标检测值也分别与预训练时的音频指标样本值和音频指标实测值类似，只是应用于不同的阶段，此处通过采用不同的命名加以区分。可选地，为提高实际调整播放参数的效率，预设空间音频可以与空间音频样本不同。

应理解，这里的车载音响强调的是车载音响系统中的扬声器、解码器、渲染器等硬件，若执行本公开的方法的计算装置是车载音响系统的主机，则可直接控制这些硬件解码播放预设空间音频，若执行本公开的方法的计算装置是第三方装置，则可以通过向车载音响系统的主机发送播放参数，实现经由车载音响系统的主机间接控制这些硬件解码播放预设空间音频。

在步骤S103中，获取在车内预设位置录制的车载音响所播放的音频，作为录制空间音频。车内预设位置是设置拾音器的位置，可以根据期望改善音效的位置来设置。通过获取该位置的录制空间音频，能够如实地记录此处听到的空间音频。应理解，若执行本公开的方法的计算装置是移动终端，则拾音器为移动终端的拾音器，可通过将移动终端放置在车内预设位置实现音频录制，作为示例，可通过输出提示信息来提示用户将移动终端放置在车内预设位置。若执行本公开的方法的计算装置不是移动终端，例如为车载音响系统的主机，又如为安装在车内的设备，则可以额外配置拾音器；对于后文中介绍的涉及多个车内预设位置的情况，作为示例，可配置可移动的拾音器，通过提示用户将拾音器放置在车内预设位置来实现音频录制，也可在多个车内预设位置均设置固定的拾音器，直接获取在待优化的车内预设位置处录制的音频，本公开对此不作限制。

在步骤S104中，检测录制空间音频的音频指标，得到音频指标检测值。

具体地，预设空间音频所关联的音频指标参考值是针对同样的音频指标。可选地，音频指标包括以下至少一个：平均响度、最大峰值电平、动态范围、各声道时延、频谱分量。其中，平均响度和最大峰值电平反映了声音的强弱；动态范围是声音信号最大值和最小值的比值，也可以用以10为底数的对数或以2为底数的对数表示，反映了声音的起伏；各声道时延表示不同声道的声音到达车内预设位置的时间差，各声道时延越小，音效越好；频谱分量指的是经变换后，频域中频率的幅度，在频域中描述了声音信号的特征。通过配置这些音频指标，能够实现空间音频播放音效的定量评价，便于为播放参数的调整提供客观、准确的参考。

在步骤S105中，根据音频指标参考值和音频指标检测值，确定强化信号，其中，强化信号为奖励信号或惩罚信号。

应理解，音频指标参考值是评价录制空间音频的音效的参考，若音频指标检测值足够接近音频指标参考值，就表明音效满足要求，可以确定强化信号为奖励信号，否则确定强化信号为惩罚信号。判断音频指标检测值是否足够接近音频指标参考值，可以通过计算二者之间的偏差值，再判断偏差值是否小于预设的偏差阈值来实现。

可选地，步骤S105包括：在音频指标的数量为一个的情况下，确定音频指标参考值相对于音频指标检测值的偏差值，作为音质偏差，根据音质偏差与第一预设值的大小关系，确定强化信号；在音频指标的数量为至少两个的情况下，分别确定各个音频指标的音质偏差的统计值，例如平均值、中位数、众数、指定分位点等，作为统计偏差，根据统计偏差与第二预设值的大小关系，确定强化信号。通过针对一个音频指标直接计算音质偏差，针对至少两个音频指标计算统计偏差，能够将音频指标检测值与音频指标参考值之间的差异用一个数值表示出来，再分别参考第一预设值和第二预设值来明确差异的大小程度，进而确定强化信号为奖励信号还是惩罚信号，能够实现强化信号的可靠确定。针对单个音频指标，应理解，音质偏差可以是音频指标参考值与音频指标检测值之间的差值的绝对值，对于音频指标的数量为至少两个的情况，为了统一比较标准，可进一步对差值的绝对值做归一化处理，例如计算该差值的绝对值与音频指标参考值的比值，从而利用一个百分数来反映音频指标检测值偏离音频指标参考值的程度，本公开对此不作限制。还应理解，根据实际情况，第一预设值和第二预设值可以相同，也可以不同，本公开对此同样不作限制。

在步骤S106中，将强化信号反馈至预训练的强化学习模型，以供预训练的强化学习模型确定调整播放参数。预训练的强化学习模型基于步骤S105确定的强化信号，可明确初始播放参数是否合适，并输出新的播放参数，作为调整播放参数。

在步骤S107中，控制车载音响按照调整播放参数对空间音频进行解码播放。需说明的是，该步骤强调的是在后续播放空间音频时使用的是调整播放参数，而非限定在确定出调整播放参数后必须立刻执行该步骤。作为示例，可以基于用户的操作决定是否播放空间音频，例如在确定出调整播放参数后，输出提示信息以提示用户是否需要播放空间音频，当然也可采用其他合理的方式来确定是否播放空间音频，本公开对此不作限制。此外，这里对车载音响的控制与步骤S102同理，在此不再赘述。

考虑到影响播放参数的因素众多，若针对所有情况都使用同样的调整播放参数，可能不利于音效的进一步提升。有鉴于此，本公开示例性实施例的方法还针对不同的影响因素分别进行了改进。接下来针对不同的影响因素，分别做具体介绍。

在一些实施例中，可选地，预训练的强化学习模型包括针对多个型号的车辆分别进行预训练得到的强化学习模型，相应地，步骤S101包括：从多个型号中确定一个待优化的型号；获取预训练的强化学习模型针对待优化的型号输出的车载音响的初始播放参数。这些实施例考虑的影响因素是车型。由于不同型号的车辆，其车载音响系统和车内结构往往存在差异，会对空间音频的播放音效产生影响，而同一型号的车辆则结构类似，所以在预训练阶段，通过针对多个型号的车辆分别进行预训练，并在应用于具体车辆时直接使用针对当前车型(即待优化的型号)的初始播放参数，能够令初始播放参数更适应当前车辆，降低播放参数的调整幅度，提升调整精度，从而有效提升得到的调整播放参数对当前车辆的适应性，提升在当前车辆播放空间音频的音效。应理解，在预训练阶段，可以是针对每个型号分别训练不同的模型，在应用阶段调用待优化的型号对应的模型，也可以是多个型号共用一个模型，在应用阶段将待优化的型号作为模型的输入参数，本公开对此不作限制。作为示例，待优化的型号可由用户手动输入，也可通过获取车辆系统中的车辆信息确定，本公开对此亦不作限制。

在一些实施例中，可选地，初始播放参数及预设空间音频均与音频类型相关联，并随音频类型的不同而不同。这些实施例考虑的影响因素是音频类型，例如包括新闻访谈类、音乐歌曲类、有声书类等。由于不同的音频类型在音质要求上的侧重点不同，例如新闻访谈类更侧重于人声的清晰，音乐歌曲类更侧重于不同频率成分的兼顾和空间感，有声书类需同时兼顾人声的清晰和空间感，所以对播放参数的调整也往往有不同的要求，例如对滤波特性的要求会存在显著差异。通过为不同的音频类型配置不同的初始播放参数和预设空间音频，具体来说，可以在预训练阶段就配置不同的空间音频样本，能够实现不同音频类型的独立优化，有助于提高不同音频类型的空间音频的播放音效。作为示例，可将音频类型作为模型的输入参数，使得模型能够区分不同的音频类型，在执行本公开示例性实施例的方法时，需要首先确定待优化的音频类型，即可在步骤S101中获取待优化的音频类型的初始播放参数，并在步骤S102中播放待优化的音频类型的预设空间音频。作为示例，待优化的音频类型可由用户手动输入，也可由执行本公开的方法的计算装置按照一定的顺序逐个对多个音频类型进行优化，本公开对此不作限制。

在一些实施例中，可选地，预训练的强化学习模型包括针对多个车内预设位置分别进行预训练得到的强化学习模型，相应地，步骤S101包括：从多个车内预设位置中确定一个待优化的车内预设位置；获取预训练的强化学习模型针对待优化的车内预设位置输出的车载音响的初始播放参数。这些实施例考虑的影响因素是聆听位置。从同一车载音响系统中播放出的空间音频，对于处在车内不同位置的听众而言，音效会存在差异。通过针对多个车内预设位置，例如车内不同座位处预估的人耳位置，分别进行预训练，并在应用于具体车辆时直接使用针对待优化的车内预设位置的初始播放参数，能够令初始播放参数更适应当前车内预设位置，降低播放参数的调整幅度，提升调整精度，从而有效提升得到的调整播放参数对当前车内预设位置的适应性，提升在当前车内预设位置聆听空间音频的音效。相应地，步骤S103获取的是在待优化的车内预设位置录制的音频，最终得到调整播放参数后，该待优化的车内预设位置就成为了已优化的车内预设位置，并与最终得到的调整播放参数相关联。应理解，与不同型号的车辆类似，在预训练阶段，可以是针对每个车内预设位置分别训练不同的模型，在应用阶段调用待优化的车内预设位置对应的模型，也可以是多个车内预设位置共用一个模型，在应用阶段将待优化的车内预设位置作为模型的输入参数，本公开对此不作限制。

这些实施例可对多个车内预设位置进行播放优化，也就是得到多个车内预设位置各自关联的调整播放参数。需说明的是，对于多个车内预设位置，可以在启动本方法的流程后直接对多个车内预设位置逐个进行优化，也可以每次启动本方法的流程后仅对其中部分车内预设位置逐个进行优化，还可以每次仅优化一个车内预设位置，本公开对此不作限制。

可选地，待优化的车内预设位置根据以下至少一个信息确定：用户输入信息、优先级信息、传感器检测信号，其中，传感器检测信号是表示多个车内预设位置分别是否有乘客的信号。借助用户输入信息，可以由用户自行指定待优化的车内预设位置，从而准确、可靠地确定出待优化的车内预设位置，并降低因针对不必要的车内预设位置确定调整播放参数而浪费计算资源的风险。通过配置优先级信息，能够按照优先级顺序对多个车内预设位置进行逐个优化，从而充分简化了对待优化的车内预设位置的确定。作为示例，对于常见的5座汽车，优先级信息对应的优先级顺序可从高到低排列为：主驾驶位、副驾驶位、后排左侧位、后排右侧位、后排中间位。通过配置传感器检测信号，能够检测到车内乘客分布情况，进而据此推测收听空间音频的需求，确定出待优化的车内预设位置，既提升了确定效果，又简化了用户操作。

应理解，可配置以上至少一个信息，用于确定待优化的车内预设位置。在配置有以上至少两个信息的情况下，可以单独使用其中一个信息来确定待优化的车内预设位置，也可以结合其中至少两个信息来确定待优化的车内预设位置，并且可以为不同信息配置优先级，本公开对此不作限制。

作为示例，对于启动本方法的流程后直接对多个车内预设位置逐个进行优化的情况，可配置优先级信息，按照优先级信息所规定的顺序，逐个确定待优化的车内预设位置。

作为示例，对于每次启动本方法的流程后仅对其中部分车内预设位置逐个进行优化的情况，可配置传感器检测信号和优先级信息，根据传感器检测信号确定本次要优化的位置，并在检测到两个以上的位置有乘客时，按照优先级信息所规定的顺序，从中逐个确定待优化的车内预设位置。若未检测到乘客，则可以视为误启动，不继续执行本方法的流程。

作为示例，对于每次仅优化一个车内预设位置的情况，可按照优先级逐渐降低的顺序同时配置用户输入信息、传感器检测信号、优先级信息。在启动本方法的流程后，若接收到用户输入信息，则将用户选定的车内预设位置作为待优化的车内预设位置。若未接收到用户输入信息，则先分析传感器检测信号，将检测到乘客的位置作为待优化的车内预设位置。若检测到多个车内预设位置均有乘客，可结合优先级信息，选择有乘客且优先级最高的位置作为待优化的车内预设位置。若未检测到有乘客，则基于优先级信息，将当前尚未优化过的车内预设位置中优先级最高的一个作为待优化的车内预设位置；若所有车内预设位置均已优化过，则可结合优化过的次数和优先级信息，将优化次数最少的车内预设位置作为待优化的车内预设位置；若优化次数最少的车内预设位置有多个，则选择其中优先级最高的一个。

相应地，得到多个车内预设位置的调整播放参数后，在步骤S107播放空间音频时，可先确定播放所针对的车内预设位置，再按照该车内预设位置所关联的调整播放参数执行空间音频的解码播放。关于播放时如何确定所针对的车内预设位置，可参考前文确定待优化的车内预设位置的方式，此外，也可以按照优化顺序配置默认的车内预设位置，例如选用最先优化的车内预设位置，又如选用最近一次优化的车内预设位置。对于车载音响系统关机后重新开机使用的情况，除采用前文确定待优化的车内预设位置的方式，以及恢复至默认的车内预设位置外，也可以延续上次关机时所使用的调整播放参数。

应理解，以上仅为示例性说明，并不构成对本公开的实现方式的限制。

接下来介绍本公开示例性实施例的方法如何确定调整播放参数。

在一些实施例中，可选地，在步骤S106之后，本公开示例性实施例的方法还包括：在不满足结束条件的情况下，将最近一次确定的调整播放参数作为新的初始播放参数，重复执行控制车载音响按照初始播放参数解码播放预设空间音频的步骤至将强化信号反馈至预训练的强化学习模型，以供预训练的强化学习模型确定调整播放参数的步骤，直到满足结束条件。通过重复执行步骤S102至步骤S106，能够多次反复调整播放参数，相当于在当前车辆上又对模型进行了一次反复训练，有助于进一步提升最终得到的调整播放参数对当前车辆的适应性，提升在当前车辆播放空间音频的音效。此外，通过配置结束条件，能够在反复训练模型时及时停止训练，有助于控制计算量，减少计算资源的浪费。

可选地，预设空间音频的数量为多个，一个预设空间音频播放一次；结束条件包括以下至少一个：全部预设空间音频均已被播放、音频指标参考值相对于音频指标检测值的偏差值小于第三预设值。通过在每次训练时使用不同的预设空间音频，能够提升训练效率，节约计算资源。相应地，通过将播放完全部预设空间音频作为一个结束条件，能够简便地明确训练停止的时机。通过额外配置第三预设值，进而将音频指标检测值足够接近音频指标参考值作为一个结束条件，能够在音频指标充分优化时灵活地停止训练，既能够提高训练效果，又能够节约训练所消耗的计算资源。应理解，第三预设值小于步骤S105中介绍的预设的偏差阈值，例如小于第一预设值或第二预设值。还应理解，结束条件可采用上述两个条件中的一个，也可以两个均采用，并且对于后者，可以在满足其中一个条件时就认为满足结束条件，也可以在同时满足这两个条件时认为满足结束条件，此时，对于已经满足了第一个条件，但仍未满足第二个条件的情况，可以继续循环播放全部预设空间音频，直到满足第二个条件。当然，除以上两个条件中的至少一个外，还可以进一步增加其他合理的条件，本公开对此不作限制。

可选地，多个预设空间音频包括由一个原始空间音频裁剪所得的多个空间音频时序片段。通过对一个原始空间音频进行裁剪来得到多个空间音频时序片段，既能够降低获取预设空间音频的难度，又能够缩短单个预设空间音频的长度，从而降低多次反复训练产生的耗时，有助于提升训练效率。

应理解，此处强调的是在获取预设空间音频时，可以采用裁剪原始空间音频的方式，并非限定全部预设空间音频仅能够取自单独一个原始空间音频，这意味着可以对多个原始空间音频分别进行裁剪，从而得到大量预设空间音频，并且还可以继续引入单段的预设空间音频，本公开对此不作限制。

接下来介绍启动本公开示例性实施例的方法的条件。

在一些实施例中，可选地，步骤S101包括：在满足优化条件的情况下，获取预训练的强化学习模型输出的车载音响的初始播放参数，其中，优化条件包括以下至少一个：车辆首次播放空间音频、车载音响开机、达到设定优化周期、接收到用户输入的启动指令。在车辆首次播放空间音频时，播放参数必然尚未调整，通过在此时直接启动本公开示例性实施例的方法，能够及时、有效地提升播放音效。车载音响开机时往往意味着用户需要播放音频，通过在此时启动本公开示例性实施例的方法，能够保障此次的播放音效得到提升。通过配置设定优化周期，能够周期性地优化播放音效，既可实现播放音效的持续自动化优化，又能够通过合理配置设定优化周期的时长来合理控制优化频率，减少不必要的计算资源消耗。应理解，设定优化周期可为默认值，也可由用户修改设置。通过配置用户输入的启动指令，能够遵循用户的需求，由用户主动发起优化，充分满足了用户的个性化需求，提升了启动的灵活性。

应理解，优化条件可仅配置以上一个，也可以同时配置以上至少一个，并且可以在满足其中任一条件时就认为满足优化条件，还可以在同时满足其中至少两个互不矛盾的条件时认为满足优化条件，例如在同时满足车载音响开机和达到设定优化周期的情况下，认为满足优化条件，并且所选用的条件还可与上文其他实施例进行合理结合，例如将接收到用户输入的启动指令这一条件与根据用户输入信息确定待优化的车内预设位置的实施例相结合，在用户主动启动本公开示例性实施例的方法并指定待优化的车内预设位置时，执行公开示例性实施例的方法以对待优化的车内预设位置的空间音频播放音效进行优化，确定相应的调整播放参数。其他合理的结合在此不再一一赘述。

参照图2，空间音频播放优化装置200包括获取单元201、播放单元202、录制单元203、检测单元204、确定单元205、调整单元206。

获取单元201可获取预训练的强化学习模型输出的车载音响的初始播放参数。

可选地，初始播放参数和调整播放参数均包括以下至少一个：延时、响度、滤波特性。

播放单元202可控制车载音响按照初始播放参数解码播放预设空间音频，其中，预设空间音频关联有音频指标参考值。

录制单元203可获取在车内预设位置录制的车载音响所播放的音频，作为录制空间音频。

检测单元204可检测录制空间音频的音频指标，得到音频指标检测值。

可选地，音频指标包括以下至少一个：平均响度、最大峰值电平、动态范围、各声道时延、频谱分量。

确定单元205可根据音频指标参考值和音频指标检测值，确定强化信号，其中，强化信号为奖励信号或惩罚信号。

可选地，确定单元205还可：在音频指标的数量为一个的情况下，确定音频指标参考值相对于音频指标检测值的偏差值，作为音质偏差，根据音质偏差与第一预设值的大小关系，确定强化信号；在音频指标的数量为至少两个的情况下，分别确定各个音频指标的音质偏差的统计值，作为统计偏差，根据统计偏差与第二预设值的大小关系，确定强化信号。

调整单元206可将强化信号反馈至预训练的强化学习模型，以供预训练的强化学习模型确定调整播放参数。

播放单元202还可控制车载音响按照调整播放参数对空间音频进行解码播放。

可选地，预训练的强化学习模型包括针对多个型号的车辆分别进行预训练得到的强化学习模型，获取单元201还可：从多个型号中确定一个待优化的型号；获取预训练的强化学习模型针对待优化的型号输出的车载音响的初始播放参数。

可选地，初始播放参数及预设空间音频均与音频类型相关联，并随音频类型的不同而不同。

可选地，预训练的强化学习模型包括针对多个车内预设位置分别进行预训练得到的强化学习模型，获取单元201还可：从多个车内预设位置中确定一个待优化的车内预设位置；获取预训练的强化学习模型针对待优化的车内预设位置输出的车载音响的初始播放参数。

可选地，待优化的车内预设位置根据以下至少一个信息确定：用户输入信息、优先级信息、传感器检测信号，其中，传感器检测信号是表示多个车内预设位置分别是否有乘客的信号。

可选地，装置还包括更新单元可在不满足结束条件的情况下，将最近一次确定的调整播放参数作为新的初始播放参数，重复运行播放单元202、录制单元203、检测单元204、确定单元205、调整单元206，直到满足结束条件。

可选地，预设空间音频的数量为多个，一个预设空间音频播放一次；结束条件包括以下至少一个：全部预设空间音频均已被播放、音频指标参考值相对于音频指标检测值的偏差值小于第三预设值。

可选地，获取单元201还可：在满足优化条件的情况下，获取预训练的强化学习模型输出的车载音响的初始播放参数，其中，优化条件包括以下至少一个：车辆首次播放空间音频、车载音响开机、达到设定优化周期、接收到用户输入的启动指令。

关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

以上已参照图1和图2描述了根据本公开示例性实施例的空间音频播放优化方法和装置。

图2所示出的空间音频播放优化装置中的各个单元可被配置为执行特定功能的软件、硬件、固件或上述项的任意组合。例如，各个单元可对应于专用的集成电路，也可对应于纯粹的软件代码，还可对应于软件与硬件相结合的模块。此外，各个单元所实现的一个或多个功能也可由物理实体设备(例如，处理器、客户端或服务器等)中的组件来统一执行。

此外，参照图1所描述的空间音频播放优化方法可通过记录在计算机可读存储介质上的程序(或指令)来实现。例如，根据本公开的示例性实施例，可提供存储指令的计算机可读存储介质，其中，当所述指令被至少一个计算装置运行时，促使所述至少一个计算装置执行根据本公开的空间音频播放优化方法。

上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行，应注意，计算机程序还可用于执行除了上述步骤以外的附加步骤或者在执行上述步骤时执行更为具体的处理，这些附加步骤和进一步处理的内容已经在参照图1进行相关方法的描述过程中提及，因此这里为了避免重复将不再进行赘述。

应注意，根据本公开示例性实施例的空间音频播放优化装置中的各个单元可完全依赖计算机程序的运行来实现相应的功能，即，各个单元在计算机程序的功能架构中与各步骤相应，使得整个系统通过专门的软件包(例如，lib库)而被调用，以实现相应的功能。

另一方面，图2所示的各个单元也可以通过硬件、软件、固件、中间件、微代码或其任意组合来实现。当以软件、固件、中间件或微代码实现时，用于执行相应操作的程序代码或者代码段可以存储在诸如存储介质的计算机可读介质中，使得处理器可通过读取并运行相应的程序代码或者代码段来执行相应的操作。

例如，本公开的示例性实施例还可以实现为计算装置，该计算装置包括存储部件和处理器，存储部件中存储有计算机可执行指令集合，当计算机可执行指令集合被处理器执行时，执行根据本公开示例性实施例的空间音频播放优化方法。

具体说来，计算装置可以部署在服务器或客户端中，也可以部署在分布式网络环境中的节点装置上。此外，计算装置可以是PC计算机、平板装置、个人数字助理、智能手机、web应用或其他能够执行上述指令集合的装置。

这里，计算装置并非必须是单个的计算装置，还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。计算装置还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子装置。

在计算装置中，处理器可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。

根据本公开示例性实施例的空间音频播放优化方法中所描述的某些操作可通过软件方式来实现，某些操作可通过硬件方式来实现，此外，还可通过软硬件结合的方式来实现这些操作。

处理器可运行存储在存储部件之一中的指令或代码，其中，存储部件还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，网络接口装置可采用任何已知的传输协议。

存储部件可与处理器集成为一体，例如，将RAM或闪存布置在集成电路微处理器等之内。此外，存储部件可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储部件和处理器可在操作上进行耦合，或者可例如通过I/O端口、网络连接等互相通信，使得处理器能够读取存储在存储部件中的文件。

此外，计算装置还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。计算装置的所有组件可经由总线和/或网络而彼此连接。

根据本公开示例性实施例的空间音频播放优化方法可被描述为各种互联或耦合的功能块或功能示图。然而，这些功能块或功能示图可被均等地集成为单个的逻辑装置或按照非确切的边界进行操作。

因此，参照图1所描述的空间音频播放优化方法可通过包括至少一个计算装置和至少一个存储指令的存储装置的系统来实现。

根据本公开的示例性实施例，至少一个计算装置是根据本公开示例性实施例的用于执行空间音频播放优化方法的计算装置，存储装置中存储有计算机可执行指令集合，当计算机可执行指令集合被至少一个计算装置执行时，执行参照图1所描述的空间音频播放优化方法。

以上描述了本公开的各示例性实施例，应理解，上述描述仅是示例性的，并非穷尽性的，本公开不限于所披露的各示例性实施例。在不偏离本公开的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。因此，本公开的保护范围应该以权利要求的范围为准。

Claims

1.一种空间音频播放优化方法，其特征在于，所述方法包括：

获取预训练的强化学习模型输出的车载音响的初始播放参数；

控制所述车载音响按照所述初始播放参数解码播放预设空间音频，其中，所述预设空间音频关联有音频指标参考值；

获取在车内预设位置录制的所述车载音响所播放的音频，作为录制空间音频；

检测所述录制空间音频的音频指标，得到音频指标检测值；

根据所述音频指标参考值和所述音频指标检测值，确定强化信号，其中，所述强化信号为奖励信号或惩罚信号；

将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数；

控制所述车载音响按照所述调整播放参数对空间音频进行解码播放，

其中，所述初始播放参数和所述调整播放参数均包括滤波特性，所述音频指标包括频谱分量，所述初始播放参数及所述预设空间音频均与音频类型相关联，并随音频类型的不同而不同，所述预设空间音频所关联的频谱分量参考值也与音频类型相关联，并随音频类型的不同而不同。

2.如权利要求1所述的方法，其特征在于，所述预训练的强化学习模型包括针对多个型号的车辆分别进行预训练得到的强化学习模型，其中，所述获取预训练的强化学习模型输出的车载音响的初始播放参数，包括：

从所述多个型号中确定一个待优化的型号；

获取所述预训练的强化学习模型针对所述待优化的型号输出的所述车载音响的所述初始播放参数。

3.如权利要求1所述的方法，其特征在于，所述根据所述音频指标参考值和所述音频指标检测值，确定强化信号，包括：

在所述音频指标的数量为一个的情况下，确定所述音频指标参考值相对于所述音频指标检测值的偏差值，作为音质偏差，根据所述音质偏差与第一预设值的大小关系，确定所述强化信号；

在所述音频指标的数量为至少两个的情况下，分别确定各个音频指标的所述音质偏差的统计值，作为统计偏差，根据所述统计偏差与第二预设值的大小关系，确定所述强化信号。

4.如权利要求1所述的方法，其特征在于，在所述将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数之后，所述方法还包括：

在不满足结束条件的情况下，将最近一次确定的调整播放参数作为新的初始播放参数，重复执行所述控制所述车载音响按照所述初始播放参数解码播放预设空间音频的步骤至所述将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数的步骤，直到满足所述结束条件。

5.如权利要求4所述的方法，其特征在于，

所述预设空间音频的数量为多个，一个预设空间音频播放一次；

所述结束条件包括以下至少一个：全部预设空间音频均已被播放、所述音频指标参考值相对于所述音频指标检测值的偏差值小于第三预设值。

6.如权利要求5所述的方法，其特征在于，

多个预设空间音频包括由一个原始空间音频裁剪所得的多个空间音频时序片段。

7.如权利要求1所述的方法，其特征在于，所述预训练的强化学习模型包括针对多个车内预设位置分别进行预训练得到的强化学习模型，其中，所述获取预训练的强化学习模型输出的车载音响的初始播放参数，包括：

从所述多个车内预设位置中确定一个待优化的车内预设位置；

获取所述预训练的强化学习模型针对所述待优化的车内预设位置输出的所述车载音响的所述初始播放参数。

8.如权利要求7所述的方法，其特征在于，

所述待优化的车内预设位置根据以下至少一个信息确定：用户输入信息、优先级信息、传感器检测信号，其中，所述传感器检测信号是表示所述多个车内预设位置分别是否有乘客的信号。

9.如权利要求1所述的方法，其特征在于，所述获取预训练的强化学习模型输出的车载音响的初始播放参数，包括：

在满足优化条件的情况下，获取所述预训练的强化学习模型输出的所述车载音响的所述初始播放参数，其中，所述优化条件包括以下至少一个：车辆首次播放空间音频、所述车载音响开机、达到设定优化周期、接收到用户输入的启动指令。

10.如权利要求1所述的方法，其特征在于，

所述初始播放参数和所述调整播放参数均包括以下至少一个：延时、响度；和/或

所述音频指标包括以下至少一个：平均响度、最大峰值电平、动态范围、各声道时延。

11.一种空间音频播放优化装置，其特征在于，所述装置包括：

获取单元，被配置为获取预训练的强化学习模型输出的车载音响的初始播放参数；

播放单元，被配置为控制所述车载音响按照所述初始播放参数解码播放预设空间音频，其中，所述预设空间音频关联有音频指标参考值；

录制单元，被配置为获取在车内预设位置录制的所述车载音响所播放的音频，作为录制空间音频；

检测单元，被配置为检测所述录制空间音频的音频指标，得到音频指标检测值；

确定单元，被配置为根据所述音频指标参考值和所述音频指标检测值，确定强化信号，其中，所述强化信号为奖励信号或惩罚信号；

调整单元，被配置为将所述强化信号反馈至所述预训练的强化学习模型，以供所述预训练的强化学习模型确定调整播放参数；

所述播放单元还被配置为控制所述车载音响按照所述调整播放参数对空间音频进行解码播放，

12.一种存储指令的计算机可读存储介质，其特征在于，当所述指令被至少一个计算装置运行时，促使所述至少一个计算装置执行如权利要求1至10中的任一权利要求所述的空间音频播放优化方法。

13.一种包括至少一个计算装置和至少一个存储指令的存储装置的系统，其特征在于，所述指令在被所述至少一个计算装置运行时，促使所述至少一个计算装置执行如权利要求1至10中的任一权利要求所述的空间音频播放优化方法。